Common Sense Reasoning

Common sense reasoning tasks are intended to require the model to go beyond pattern recognition. Instead, the model should use "common sense" or world knowledge to make inferences.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 501–550 of 939 papers

Title	Date	Tasks	Status
SERVAL: Synergy Learning between Vertical Models and LLMs towards Oracle-Level Zero-shot Medical Prediction	Mar 3, 2024	Common Sense ReasoningDiagnostic	—Unverified
ShotgunWSD: An unsupervised algorithm for global word sense disambiguation inspired by DNA sequencing	Jul 25, 2017	Common Sense ReasoningWord Sense Disambiguation	—Unverified
Shrinkage Initialization for Smooth Learning of Neural Networks	Apr 12, 2025	Common Sense Reasoning	—Unverified
SocialNLP 2018 EmotionX Challenge Overview: Recognizing Emotions in Dialogues	Jul 1, 2018	Common Sense ReasoningEmotion Recognition	—Unverified
Soft Label PU Learning	May 3, 2024	Common Sense Reasoning	—Unverified
SOLVE: Synergy of Language-Vision and End-to-End Networks for Autonomous Driving	May 22, 2025	Autonomous DrivingCommon Sense Reasoning	—Unverified
Some Extensions of Probabilistic Logic	Mar 27, 2013	Bayesian InferenceCommon Sense Reasoning	—Unverified
Some Preliminary Steps Towards Metaverse Logic	Jul 10, 2023	AI AgentCommon Sense Reasoning	—Unverified
Sort Story: Sorting Jumbled Images and Captions into Stories	Jun 23, 2016	Common Sense ReasoningDocument Summarization	—Unverified
Spatial Knowledge Graph-Guided Multimodal Synthesis	May 28, 2025	Common Sense ReasoningKnowledge Graphs	—Unverified
SSN-NLP at SemEval-2020 Task 4: Text Classification and Generation on Common Sense Context Using Neural Networks	Dec 1, 2020	Common Sense ReasoningMachine Translation	—Unverified
Stacking with Auxiliary Features for Visual Question Answering	Jun 1, 2018	Common Sense ReasoningQuestion Answering	—Unverified
Stating the Obvious: Extracting Visual Common Sense Knowledge	Jun 1, 2016	Common Sense ReasoningObject Detection	—Unverified
Stay on topic with Classifier-Free Guidance	Jun 30, 2023	Code GenerationCommon Sense Reasoning	—Unverified
Story Comprehension for Predicting What Happens Next	Sep 1, 2017	Common Sense ReasoningNatural Language Understanding	—Unverified
Story Generation with Commonsense Knowledge Graphs and Axioms	Sep 3, 2021	Common Sense ReasoningKnowledge Graphs	—Unverified
Strongly-Typed Agents are Guaranteed to Interact Safely	Feb 24, 2017	blind source separationCommon Sense Reasoning	—Unverified
Structured Event Reasoning with Large Language Models	Aug 28, 2024	Common Sense Reasoning	—Unverified
Summarize the Past to Predict the Future: Natural Language Descriptions of Context Boost Multimodal Object Interaction Anticipation	Jan 22, 2023	Common Sense ReasoningImage Captioning	—Unverified
Sunny and Dark Outside?! Improving Answer Consistency in VQA through Entailed Question Generation	Sep 10, 2019	Common Sense ReasoningData Augmentation	—Unverified
SWAG: A Large-Scale Adversarial Dataset for Grounded Commonsense Inference	Aug 16, 2018	Common Sense ReasoningMultiple-choice	—Unverified
Sweetening Ontologies cont'd	Nov 1, 2013	Common Sense Reasoning	—Unverified
Symbol Grounding via Chaining of Morphisms	Mar 13, 2017	Common Sense Reasoning	—Unverified
Synthesizing Programmatic Reinforcement Learning Policies with Large Language Model Guided Search	May 26, 2024	Common Sense ReasoningLanguage Modeling	—Unverified
Systematic Error Analysis of the Stanford Question Answering Dataset	Jul 1, 2018	Common Sense ReasoningMachine Reading Comprehension	—Unverified
Tabular Data Imputation: Choose KNN over Deep Learning	Sep 29, 2021	Common Sense ReasoningDeep Learning	—Unverified
Tag Map: A Text-Based Map for Spatial Reasoning and Navigation with Large Language Models	Sep 23, 2024	Common Sense ReasoningSpatial Reasoning	—Unverified
TakeLab at SemEval-2017 Task 6: \#RankingHumorIn4Pages	Aug 1, 2017	Common Sense ReasoningHumor Detection	—Unverified
TakeLab at SemEval-2018 Task12: Argument Reasoning Comprehension with Skip-Thought Vectors	Jun 1, 2018	Common Sense ReasoningNatural Language Inference	—Unverified
TaskMatrix.AI: Completing Tasks by Connecting Foundation Models with Millions of APIs	Mar 29, 2023	Code GenerationCommon Sense Reasoning	—Unverified
TeamJUST at SemEval-2020 Task 4: Commonsense Validation and Explanation Using Ensembling Techniques	Dec 1, 2020	Common Sense ReasoningSentence	—Unverified
Telecom Language Models: Must They Be Large?	Mar 7, 2024	Common Sense ReasoningRetrieval-augmented Generation	—Unverified
Tell Codec What Worth Compressing: Semantically Disentangled Image Coding for Machine with LMMs	Aug 16, 2024	Common Sense Reasoningimage-classification	—Unverified
Tell Me Why: Incentivizing Explanations	Feb 19, 2025	Common Sense Reasoning	—Unverified
Temporal Common Sense Acquisition with Minimal Supervision	May 8, 2020	Common Sense ReasoningLanguage Modeling	—Unverified
TETRIS: Towards Exploring the Robustness of Interactive Segmentation	Feb 9, 2024	Adversarial AttackAdversarial Robustness	—Unverified
TGEA: An Error-Annotated Dataset and Benchmark Tasks for TextGeneration from Pretrained Language Models	Aug 1, 2021	Common Sense ReasoningDiagnostic	—Unverified
The Case for a Mixed-Initiative Collaborative Neuroevolution Approach	Aug 5, 2014	Common Sense ReasoningGame Design	—Unverified
The Claude 3 Model Family: Opus, Sonnet, Haiku	Mar 4, 2024	1 Image, 2*2 StitchingArithmetic Reasoning	—Unverified
The Collision of Quality and Technology with Reality	Mar 1, 2018	Common Sense Reasoning	—Unverified
The Computational Principles of Learning Ability	Sep 23, 2015	Common Sense Reasoning	—Unverified
The Embeddings World and Artificial General Intelligence	Sep 14, 2022	Common Sense Reasoning	—Unverified
The ILASP system for Inductive Learning of Answer Set Programs	May 2, 2020	Common Sense ReasoningInductive Learning	—Unverified
The Lottery LLM Hypothesis, Rethinking What Abilities Should LLM Compression Preserve?	Feb 24, 2025	Arithmetic ReasoningCommon Sense Reasoning	—Unverified
The Neural Metric Factorization for Computational Drug Repositioning	Sep 16, 2021	Common Sense ReasoningDrug Discovery	—Unverified
The Physics of Text: Ontological Realism in Information Extraction	Jun 1, 2016	Common Sense ReasoningOpen Information Extraction	—Unverified
The Power of Question Translation Training in Multilingual Reasoning: Broadened Scope and Deepened Insights	May 2, 2024	Common Sense ReasoningTranslation	—Unverified
The Quest for Visual Understanding: A Journey Through the Evolution of Visual Question Answering	Jan 13, 2025	Common Sense ReasoningQuestion Answering	—Unverified
The RatioLog Project: Rational Extensions of Logical Reasoning	Mar 20, 2015	BIG-bench Machine LearningCommon Sense Reasoning	—Unverified
The Rosetta Paradox: Domain-Specific Performance Inversions in Large Language Models	Dec 9, 2024	Common Sense ReasoningSpecificity	—Unverified

Show:10 25 50

← PrevPage 11 of 19Next →

All datasets WinoGrande arc_challenge arc_easy ReCoRD CommonsenseQA PARus RuCoS RWSD BIG-bench (Causal Judgment)BIG-bench (Date Understanding)BIG-bench (Disambiguation QA)BIG-bench (Sports Understanding)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ST-MoE-32B 269B (fine-tuned)	Accuracy	96.1	—	Unverified
2	Unicorn 11B (fine-tuned)	Accuracy	91.3	—	Unverified
3	CompassMTL 567M with Tailor	Accuracy	90.5	—	Unverified
4	CompassMTL 567M	Accuracy	89.6	—	Unverified
5	UnifiedQA 11B (fine-tuned)	Accuracy	89.4	—	Unverified
6	Claude 3 Opus (5-shot)	Accuracy	88.5	—	Unverified
7	GPT-4 (5-shot)	Accuracy	87.5	—	Unverified
8	ExDeBERTa 567M	Accuracy	87	—	Unverified
9	LLaMA-2 13B + MixLoRA	Accuracy	86.3	—	Unverified
10	LLaMA3 8B+MoSLoRA	Accuracy	85.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 (few-shot, k=25)	Accuracy	96.4	—	Unverified
2	PaLM 2 (few-shot, CoT, SC)	Accuracy	95.1	—	Unverified
3	Shivaay (4B, few-shot, k=8)	Accuracy	91.04	—	Unverified
4	StupidLLM	Accuracy	91.03	—	Unverified
5	Claude 2 (few-shot, k=5)	Accuracy	91	—	Unverified
6	Claude 1.3 (few-shot, k=5)	Accuracy	90	—	Unverified
7	PaLM 540B (Self Improvement, Self Consistency)	Accuracy	89.8	—	Unverified
8	PaLM 540B (Self Consistency)	Accuracy	88.7	—	Unverified
9	PaLM 540B (Self Improvement, CoT Prompting)	Accuracy	88.3	—	Unverified
10	PaLM 540B (Self Improvement, Standard-Prompting)	Accuracy	87.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ST-MoE-32B 269B (fine-tuned)	Accuracy	95.2	—	Unverified
2	LLaMA 3 8B+MoSLoRA (fine-tuned)	Accuracy	90.5	—	Unverified
3	PaLM 2-L (1-shot)	Accuracy	89.7	—	Unverified
4	PaLM 2-M (1-shot)	Accuracy	88	—	Unverified
5	LLaMA-3 8B + MixLoRA	Accuracy	86.5	—	Unverified
6	Camelidae-8×34B	Accuracy	86.2	—	Unverified
7	PaLM 2-S (1-shot)	Accuracy	85.6	—	Unverified
8	LLaMA 65B + CFG (0-shot)	Accuracy	84.2	—	Unverified
9	GAL 120B (0-shot)	Accuracy	83.8	—	Unverified
10	LLaMA-2 13B + MixLoRA	Accuracy	83.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Turing NLR v5 XXL 5.4B (fine-tuned)	EM	95.9	—	Unverified
2	ST-MoE-32B 269B (fine-tuned)	EM	95.1	—	Unverified
3	T5-11B	F1	94.1	—	Unverified
4	DeBERTa-1.5B	EM	94.1	—	Unverified
5	PaLM 540B (finetuned)	EM	94	—	Unverified
6	Vega v2 6B (fine-tuned)	EM	93.9	—	Unverified
7	PaLM 2-L (one-shot)	F1	93.8	—	Unverified
8	T5-XXL 11B (fine-tuned)	EM	93.4	—	Unverified
9	PaLM 2-M (one-shot)	F1	92.4	—	Unverified
10	PaLM 2-S (one-shot)	F1	92.1	—	Unverified