Common Sense Reasoning

Common sense reasoning tasks are intended to require the model to go beyond pattern recognition. Instead, the model should use "common sense" or world knowledge to make inferences.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 851–900 of 939 papers

Title	Date	Tasks	Status
Editing Common Sense in Transformers	May 24, 2023	Common Sense ReasoningModel Editing	CodeCode Available
DynMoLE: Boosting Mixture of LoRA Experts Fine-Tuning with a Hybrid Routing Mechanism	Apr 1, 2025	Common Sense ReasoningComputational Efficiency	CodeCode Available
Being Right for Whose Right Reasons?	Jun 1, 2023	Common Sense ReasoningFairness	CodeCode Available
LoSiA: Efficient High-Rank Fine-Tuning via Subnet Localization and Optimization	Jul 6, 2025	Common Sense Reasoningparameter-efficient fine-tuning	CodeCode Available
Incorporating Chinese Characters of Words for Lexical Sememe Prediction	Jun 17, 2018	Common Sense ReasoningPrediction	CodeCode Available
AmbiK: Dataset of Ambiguous Tasks in Kitchen Environment	Jun 4, 2025	Common Sense Reasoning	CodeCode Available
LVLM-Compress-Bench: Benchmarking the Broader Impact of Large Vision-Language Model Compression	Mar 6, 2025	BenchmarkingCommon Sense Reasoning	CodeCode Available
Don't Fight Hallucinations, Use Them: Estimating Image Realism using NLI over Atomic Facts	Mar 20, 2025	Common Sense ReasoningNatural Language Inference	CodeCode Available
AILS-NTUA at SemEval-2024 Task 9: Cracking Brain Teasers: Transformer Models for Lateral Thinking Puzzles	Apr 1, 2024	Common Sense ReasoningMultiple-choice	CodeCode Available
PredictaBoard: Benchmarking LLM Score Predictability	Feb 20, 2025	BenchmarkingCommon Sense Reasoning	CodeCode Available
Titans: Learning to Memorize at Test Time	Dec 31, 2024	Common Sense ReasoningLanguage Modeling	CodeCode Available
An Evaluation of PredPatt and Open IE via Stage 1 Semantic Role Labeling	Jan 1, 2017	Common Sense ReasoningOpen Information Extraction	CodeCode Available
Improving Sample Efficiency of Reinforcement Learning with Background Knowledge from Large Language Models	Jul 4, 2024	Common Sense ReasoningReinforcement Learning (RL)	CodeCode Available
Do Machine Learning Models Learn Statistical Rules Inferred from Data?	Mar 2, 2023	Common Sense ReasoningImputation	CodeCode Available
Self-Refined Large Language Model as Automated Reward Function Designer for Deep Reinforcement Learning in Robotics	Sep 13, 2023	Common Sense ReasoningDeep Reinforcement Learning	CodeCode Available
Do Language Models Understand Morality? Towards a Robust Detection of Moral Content	Jun 6, 2024	Common Sense ReasoningNatural Language Inference	CodeCode Available
Improving Neural Story Generation by Targeted Common Sense Grounding	Aug 26, 2019	Common Sense ReasoningMulti-Task Learning	CodeCode Available
Telling Stories for Common Sense Zero-Shot Action Recognition	Sep 29, 2023	Action RecognitionArticles	CodeCode Available
A Group-Specific Approach to NLP for Hate Speech Detection	Apr 21, 2023	Common Sense ReasoningEthics	CodeCode Available
Prime the search: Using large language models for guiding geometric task and motion planning by warm-starting tree search	Jun 8, 2025	Common Sense ReasoningMotion Planning	CodeCode Available
A Neural Conversational Model	Jun 19, 2015	Common Sense Reasoningmodel	CodeCode Available
Temporal Relational Reasoning in Videos	Nov 22, 2017	Action ClassificationAction Recognition	CodeCode Available
MEMEX: Detecting Explanatory Evidence for Memes via Knowledge-Enriched Contextualization	May 25, 2023	Common Sense Reasoning	CodeCode Available
Improved Word Representation Learning with Sememes	Jul 1, 2017	Common Sense ReasoningLanguage Modeling	CodeCode Available
Identifying relevant common sense information in knowledge graphs	May 1, 2022	Common Sense ReasoningKnowledge Graphs	CodeCode Available
Visual Word2Vec (vis-w2v): Learning Visually Grounded Word Embeddings Using Abstract Scenes	Nov 22, 2015	Common Sense ReasoningImage Retrieval	CodeCode Available
BAMO at SemEval-2024 Task 9: BRAINTEASER: A Novel Task Defying Common Sense	Jun 7, 2024	Common Sense ReasoningSentence	CodeCode Available
Hybrid Reasoning Based on Large Language Models for Autonomous Car Driving	Feb 21, 2024	Autonomous DrivingAutonomous Vehicles	CodeCode Available
WinoGAViL: Gamified Association Benchmark to Challenge Vision-and-Language Models	Jul 25, 2022	Common Sense ReasoningGeneral Knowledge	CodeCode Available
ACCORD: Closing the Commonsense Measurability Gap	Jun 4, 2024	BenchmarkingCommon Sense Reasoning	CodeCode Available
A Survey of Video Datasets for Grounded Event Understanding	Jun 14, 2024	Common Sense ReasoningEvent Extraction	CodeCode Available
Human-AI collectives produce the most accurate differential diagnoses	Jun 21, 2024	Common Sense Reasoning	CodeCode Available
Acquiring Common Sense Spatial Knowledge through Implicit Spatial Templates	Nov 18, 2017	Common Sense ReasoningQuestion Answering	CodeCode Available
DKN: Deep Knowledge-Aware Network for News Recommendation	Jan 25, 2018	Click-Through Rate PredictionCommon Sense Reasoning	CodeCode Available
HL Dataset: Visually-grounded Description of Scenes, Actions and Rationales	Feb 23, 2023	Common Sense ReasoningVocal Bursts Intensity Prediction	CodeCode Available
Hierarchical Spatial Proximity Reasoning for Vision-and-Language Navigation	Mar 18, 2024	Common Sense ReasoningEfficient Exploration	CodeCode Available
Mixture-of-Subspaces in Low-Rank Adaptation	Jun 16, 2024	Common Sense ReasoningImage Generation	CodeCode Available
Graph-Based Reasoning over Heterogeneous External Knowledge for Commonsense Question Answering	Sep 9, 2019	Common Sense ReasoningGraph Attention	CodeCode Available
That and There: Judging the Intent of Pointing Actions with Robotic Arms	Dec 13, 2019	Common Sense Reasoning	CodeCode Available
DiffG-RL: Leveraging Difference between State and Common Sense	Nov 29, 2022	Common Sense Reasoningtext-based games	CodeCode Available
Detecting Persuasive Atypicality by Modeling Contextual Compatibility	Jan 1, 2021	Common Sense Reasoning	CodeCode Available
Modeling Event Plausibility with Consistent Conceptual Abstraction	Apr 20, 2021	Common Sense Reasoning	CodeCode Available
QASC: A Dataset for Question Answering via Sentence Composition	Oct 25, 2019	Common Sense ReasoningMulti-hop Question Answering	CodeCode Available
CODAH: An Adversarially-Authored Question Answering Dataset for Common Sense	Jun 1, 2019	Common Sense ReasoningQuestion Answering	CodeCode Available
SimpleMind adds thinking to deep neural networks	Dec 2, 2022	Common Sense ReasoningDecision Making	CodeCode Available
Modeling User Exposure in Recommendation	Oct 23, 2015	Collaborative FilteringCommon Sense Reasoning	CodeCode Available
GradSkip: Communication-Accelerated Local Gradient Methods with Better Computational Complexity	Oct 28, 2022	Common Sense ReasoningDistributed Optimization	CodeCode Available
QUENCH: Measuring the gap between Indic and Non-Indic Contextual General Reasoning in LLMs	Dec 16, 2024	BenchmarkingCommon Sense Reasoning	CodeCode Available
Deliberative and Conceptual Inference in Service Robots	Dec 13, 2020	Common Sense ReasoningDecision Making	CodeCode Available
Morph Call: Probing Morphosyntactic Content of Multilingual Transformers	Apr 26, 2021	Common Sense ReasoningMORPH	CodeCode Available

Show:10 25 50

← PrevPage 18 of 19Next →

All datasets WinoGrande arc_challenge arc_easy ReCoRD CommonsenseQA PARus RuCoS RWSD BIG-bench (Causal Judgment)BIG-bench (Date Understanding)BIG-bench (Disambiguation QA)BIG-bench (Sports Understanding)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ST-MoE-32B 269B (fine-tuned)	Accuracy	96.1	—	Unverified
2	Unicorn 11B (fine-tuned)	Accuracy	91.3	—	Unverified
3	CompassMTL 567M with Tailor	Accuracy	90.5	—	Unverified
4	CompassMTL 567M	Accuracy	89.6	—	Unverified
5	UnifiedQA 11B (fine-tuned)	Accuracy	89.4	—	Unverified
6	Claude 3 Opus (5-shot)	Accuracy	88.5	—	Unverified
7	GPT-4 (5-shot)	Accuracy	87.5	—	Unverified
8	ExDeBERTa 567M	Accuracy	87	—	Unverified
9	LLaMA-2 13B + MixLoRA	Accuracy	86.3	—	Unverified
10	LLaMA3 8B+MoSLoRA	Accuracy	85.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 (few-shot, k=25)	Accuracy	96.4	—	Unverified
2	PaLM 2 (few-shot, CoT, SC)	Accuracy	95.1	—	Unverified
3	Shivaay (4B, few-shot, k=8)	Accuracy	91.04	—	Unverified
4	StupidLLM	Accuracy	91.03	—	Unverified
5	Claude 2 (few-shot, k=5)	Accuracy	91	—	Unverified
6	Claude 1.3 (few-shot, k=5)	Accuracy	90	—	Unverified
7	PaLM 540B (Self Improvement, Self Consistency)	Accuracy	89.8	—	Unverified
8	PaLM 540B (Self Consistency)	Accuracy	88.7	—	Unverified
9	PaLM 540B (Self Improvement, CoT Prompting)	Accuracy	88.3	—	Unverified
10	PaLM 540B (Self Improvement, Standard-Prompting)	Accuracy	87.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ST-MoE-32B 269B (fine-tuned)	Accuracy	95.2	—	Unverified
2	LLaMA 3 8B+MoSLoRA (fine-tuned)	Accuracy	90.5	—	Unverified
3	PaLM 2-L (1-shot)	Accuracy	89.7	—	Unverified
4	PaLM 2-M (1-shot)	Accuracy	88	—	Unverified
5	LLaMA-3 8B + MixLoRA	Accuracy	86.5	—	Unverified
6	Camelidae-8×34B	Accuracy	86.2	—	Unverified
7	PaLM 2-S (1-shot)	Accuracy	85.6	—	Unverified
8	LLaMA 65B + CFG (0-shot)	Accuracy	84.2	—	Unverified
9	GAL 120B (0-shot)	Accuracy	83.8	—	Unverified
10	LLaMA-2 13B + MixLoRA	Accuracy	83.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Turing NLR v5 XXL 5.4B (fine-tuned)	EM	95.9	—	Unverified
2	ST-MoE-32B 269B (fine-tuned)	EM	95.1	—	Unverified
3	T5-11B	F1	94.1	—	Unverified
4	DeBERTa-1.5B	EM	94.1	—	Unverified
5	PaLM 540B (finetuned)	EM	94	—	Unverified
6	Vega v2 6B (fine-tuned)	EM	93.9	—	Unverified
7	PaLM 2-L (one-shot)	F1	93.8	—	Unverified
8	T5-XXL 11B (fine-tuned)	EM	93.4	—	Unverified
9	PaLM 2-M (one-shot)	F1	92.4	—	Unverified
10	PaLM 2-S (one-shot)	F1	92.1	—	Unverified