Common Sense Reasoning

Common sense reasoning tasks are intended to require the model to go beyond pattern recognition. Instead, the model should use "common sense" or world knowledge to make inferences.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–700 of 939 papers

Title	Date	Tasks	Status	Hype
Consolidating Commonsense Knowledge	Jun 10, 2020	Common Sense ReasoningKnowledge Graphs	—Unverified	0
Language Models as Fact Checkers?	Jun 7, 2020	Common Sense ReasoningLanguage Modeling	—Unverified	0
DeBERTa: Decoding-enhanced BERT with Disentangled Attention	Jun 5, 2020	Common Sense ReasoningCoreference Resolution	CodeCode Available	2
Analogical Proportions	Jun 4, 2020	Common Sense ReasoningLanguage Acquisition	—Unverified	0
Language Models are Few-Shot Learners	May 28, 2020	answerability predictionArticles	CodeCode Available	3
Common Sense or World Knowledge? Investigating Adapter-Based Knowledge Injection into Pretrained Transformers	May 24, 2020	Common Sense ReasoningWorld Knowledge	CodeCode Available	1
Fractional trends and cycles in macroeconomic time series	May 23, 2020	Common Sense ReasoningTime Series	—Unverified	0
Pretraining with Contrastive Sentence Objectives Improves Discourse Performance of Language Models	May 20, 2020	Common Sense ReasoningNatural Language Inference	—Unverified	0
Temporal Common Sense Acquisition with Minimal Supervision	May 8, 2020	Common Sense ReasoningLanguage Modeling	—Unverified	0
The Sensitivity of Language Models and Humans to Winograd Schema Perturbations	May 4, 2020	Common Sense ReasoningDiagnostic	CodeCode Available	0
ProtoQA: A Question Answering Dataset for Prototypical Common-Sense Reasoning	May 2, 2020	Common Sense ReasoningQuestion Answering	CodeCode Available	1
UnifiedQA: Crossing Format Boundaries With a Single QA System	May 2, 2020	Common Sense ReasoningLanguage Modeling	CodeCode Available	1
The ILASP system for Inductive Learning of Answer Set Programs	May 2, 2020	Common Sense ReasoningInductive Learning	—Unverified	0
Mandarinograd: A Chinese Collection of Winograd Schemas	May 1, 2020	Common Sense ReasoningNatural Language Inference	—Unverified	0
Conversational Word Embedding for Retrieval-Based Dialog System	Apr 28, 2020	Common Sense ReasoningMachine Translation	CodeCode Available	1
Generative Data Augmentation for Commonsense Reasoning	Apr 24, 2020	Common Sense ReasoningCoreference Resolution	CodeCode Available	1
Dark, Beyond Deep: A Paradigm Shift to Cognitive AI with Humanlike Common Sense	Apr 20, 2020	Common Sense ReasoningSmall Data Image Classification	—Unverified	0
Ecological Semantics: Programming Environments for Situated Language Understanding	Mar 10, 2020	Common Sense ReasoningGrounded language learning	—Unverified	0
1D Probabilistic Undersampling Pattern Optimization for MR Image Reconstruction	Mar 8, 2020	Common Sense ReasoningImage Reconstruction	CodeCode Available	0
Active Model Estimation in Markov Decision Processes	Mar 6, 2020	Common Sense ReasoningEfficient Exploration	—Unverified	0
Learning-based Practical Smartphone Eavesdropping with Built-in Accelerometer	Feb 26, 2020	Common Sense Reasoning	—Unverified	0
KoGuN: Accelerating Deep Reinforcement Learning via Integrating Human Suboptimal Knowledge	Feb 18, 2020	Common Sense Reasoningcontinuous-control	—Unverified	0
A Machine Consciousness architecture based on Deep Learning and Gaussian Processes	Feb 2, 2020	Common Sense ReasoningDeep Learning	—Unverified	0
Debate Dynamics for Human-comprehensible Fact-checking on Knowledge Graphs	Jan 9, 2020	Common Sense ReasoningFact Checking	—Unverified	0
Using ConceptNet to Teach Common Sense to an Automated Theorem Prover	Dec 30, 2019	Common Sense ReasoningKnowledge Graphs	—Unverified	0
A Logical Model for Supporting Social Commonsense Knowledge Acquisition	Dec 25, 2019	Common Sense Reasoning	—Unverified	0
Design and Implementation of Linked Planning Domain Definition Language	Dec 17, 2019	Common Sense Reasoning	—Unverified	0
That and There: Judging the Intent of Pointing Actions with Robotic Arms	Dec 13, 2019	Common Sense Reasoning	CodeCode Available	0
PIQA: Reasoning about Physical Commonsense in Natural Language	Nov 26, 2019	ArticlesCommon Sense Reasoning	CodeCode Available	1
Generating Interactive Worlds with Text	Nov 20, 2019	BIG-bench Machine LearningCommon Sense Reasoning	—Unverified	0
CommonGen: A Constrained Text Generation Challenge for Generative Commonsense Reasoning	Nov 9, 2019	Common Sense ReasoningQuestion Answering	CodeCode Available	0
Why Do Masked Neural Language Models Still Need Common Sense Knowledge?	Nov 8, 2019	Common Sense ReasoningQuestion Answering	—Unverified	0
How Pre-trained Word Representations Capture Commonsense Physical Comparisons	Nov 1, 2019	Common Sense Reasoning	—Unverified	0
KARNA at COIN Shared Task 1: Bidirectional Encoder Representations from Transformers with relational knowledge for machine comprehension with common sense	Nov 1, 2019	Common Sense ReasoningReading Comprehension	—Unverified	0
Commonsense about Human Senses: Labeled Data Collection Processes	Nov 1, 2019	BIG-bench Machine LearningCommon Sense Reasoning	—Unverified	0
Pingan Smart Health and SJTU at COIN - Shared Task: utilizing Pre-trained Language Models and Common-sense Knowledge in Machine Reading Tasks	Nov 1, 2019	Common Sense ReasoningMachine Reading Comprehension	—Unverified	0
Towards Generalizable Neuro-Symbolic Systems for Commonsense Question Answering	Oct 30, 2019	Common Sense ReasoningQuestion Answering	—Unverified	0
QASC: A Dataset for Question Answering via Sentence Composition	Oct 25, 2019	Common Sense ReasoningMulti-hop Question Answering	CodeCode Available	0
Assisting human experts in the interpretation of their visual process: A case study on assessing copper surface adhesive potency	Oct 24, 2019	Common Sense Reasoning	—Unverified	0
Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer	Oct 23, 2019	Answer GenerationCommon Sense Reasoning	CodeCode Available	2
Learning Continuous 3D Reconstructions for Geometrically Aware Grasping	Oct 2, 2019	3D geometry3D Reconstruction	—Unverified	0
ALBERT: A Lite BERT for Self-supervised Learning of Language Representations	Sep 26, 2019	Common Sense ReasoningGPU	CodeCode Available	2
Measuring Numerical Common Sense: Is A Word Embedding Approach Effective?	Sep 25, 2019	Common Sense Reasoningregression	—Unverified	0
Linguistic Embeddings as a Common-Sense Knowledge Repository: Challenges and Opportunities	Sep 25, 2019	Common Sense ReasoningMachine Translation	—Unverified	0
Why Does the VQA Model Answer No?: Improving Reasoning through Visual and Linguistic Inference	Sep 25, 2019	Common Sense ReasoningQuestion Answering	—Unverified	0
Conversational AI : Open Domain Question Answering and Commonsense Reasoning	Sep 18, 2019	Common Sense ReasoningOpen-Domain Question Answering	—Unverified	0
Bridging Visual Perception with Contextual Semantics for Understanding Robot Manipulation Tasks	Sep 16, 2019	AttributeCommon Sense Reasoning	—Unverified	0
Probabilistic framework for solving Visual Dialog	Sep 11, 2019	Common Sense ReasoningVisual Dialog	—Unverified	0
Sunny and Dark Outside?! Improving Answer Consistency in VQA through Entailed Question Generation	Sep 10, 2019	Common Sense ReasoningData Augmentation	—Unverified	0
Graph-Based Reasoning over Heterogeneous External Knowledge for Commonsense Question Answering	Sep 9, 2019	Common Sense ReasoningGraph Attention	CodeCode Available	0

Show:10 25 50

← PrevPage 14 of 19Next →

All datasets WinoGrande arc_challenge arc_easy ReCoRD CommonsenseQA PARus RuCoS RWSD BIG-bench (Causal Judgment)BIG-bench (Date Understanding)BIG-bench (Disambiguation QA)BIG-bench (Sports Understanding)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ST-MoE-32B 269B (fine-tuned)	Accuracy	96.1	—	Unverified
2	Unicorn 11B (fine-tuned)	Accuracy	91.3	—	Unverified
3	CompassMTL 567M with Tailor	Accuracy	90.5	—	Unverified
4	CompassMTL 567M	Accuracy	89.6	—	Unverified
5	UnifiedQA 11B (fine-tuned)	Accuracy	89.4	—	Unverified
6	Claude 3 Opus (5-shot)	Accuracy	88.5	—	Unverified
7	GPT-4 (5-shot)	Accuracy	87.5	—	Unverified
8	ExDeBERTa 567M	Accuracy	87	—	Unverified
9	LLaMA-2 13B + MixLoRA	Accuracy	86.3	—	Unverified
10	LLaMA3 8B+MoSLoRA	Accuracy	85.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 (few-shot, k=25)	Accuracy	96.4	—	Unverified
2	PaLM 2 (few-shot, CoT, SC)	Accuracy	95.1	—	Unverified
3	Shivaay (4B, few-shot, k=8)	Accuracy	91.04	—	Unverified
4	StupidLLM	Accuracy	91.03	—	Unverified
5	Claude 2 (few-shot, k=5)	Accuracy	91	—	Unverified
6	Claude 1.3 (few-shot, k=5)	Accuracy	90	—	Unverified
7	PaLM 540B (Self Improvement, Self Consistency)	Accuracy	89.8	—	Unverified
8	PaLM 540B (Self Consistency)	Accuracy	88.7	—	Unverified
9	PaLM 540B (Self Improvement, CoT Prompting)	Accuracy	88.3	—	Unverified
10	PaLM 540B (Self Improvement, Standard-Prompting)	Accuracy	87.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ST-MoE-32B 269B (fine-tuned)	Accuracy	95.2	—	Unverified
2	LLaMA 3 8B+MoSLoRA (fine-tuned)	Accuracy	90.5	—	Unverified
3	PaLM 2-L (1-shot)	Accuracy	89.7	—	Unverified
4	PaLM 2-M (1-shot)	Accuracy	88	—	Unverified
5	LLaMA-3 8B + MixLoRA	Accuracy	86.5	—	Unverified
6	Camelidae-8×34B	Accuracy	86.2	—	Unverified
7	PaLM 2-S (1-shot)	Accuracy	85.6	—	Unverified
8	LLaMA 65B + CFG (0-shot)	Accuracy	84.2	—	Unverified
9	GAL 120B (0-shot)	Accuracy	83.8	—	Unverified
10	LLaMA-2 13B + MixLoRA	Accuracy	83.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Turing NLR v5 XXL 5.4B (fine-tuned)	EM	95.9	—	Unverified
2	ST-MoE-32B 269B (fine-tuned)	EM	95.1	—	Unverified
3	T5-11B	F1	94.1	—	Unverified
4	DeBERTa-1.5B	EM	94.1	—	Unverified
5	PaLM 540B (finetuned)	EM	94	—	Unverified
6	Vega v2 6B (fine-tuned)	EM	93.9	—	Unverified
7	PaLM 2-L (one-shot)	F1	93.8	—	Unverified
8	T5-XXL 11B (fine-tuned)	EM	93.4	—	Unverified
9	PaLM 2-M (one-shot)	F1	92.4	—	Unverified
10	PaLM 2-S (one-shot)	F1	92.1	—	Unverified