Common Sense Reasoning

Common sense reasoning tasks are intended to require the model to go beyond pattern recognition. Instead, the model should use "common sense" or world knowledge to make inferences.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 901–939 of 939 papers

Title	Date	Tasks	Status
CLDR: Contrastive Learning Drug Response Models from Natural Language Supervision	Dec 17, 2023	Common Sense ReasoningContrastive Learning	CodeCode Available
Ranking and Selecting Multi-Hop Knowledge Paths to Better Predict Human Needs	Apr 1, 2019	Common Sense Reasoning	CodeCode Available
SocialIQA: Commonsense Reasoning about Social Interactions	Apr 22, 2019	Common Sense ReasoningCoreference Resolution	CodeCode Available
The Argument Reasoning Comprehension Task: Identification and Reconstruction of Implicit Warrants	Aug 4, 2017	2kCommon Sense Reasoning	CodeCode Available
GIST at SemEval-2018 Task 12: A network transferring inference knowledge to Argument Reasoning Comprehension task	Jun 1, 2018	Common Sense ReasoningNatural Language Inference	CodeCode Available
1D Probabilistic Undersampling Pattern Optimization for MR Image Reconstruction	Mar 8, 2020	Common Sense ReasoningImage Reconstruction	CodeCode Available
GestureGPT: Toward Zero-Shot Free-Form Hand Gesture Understanding with Large Language Model Agents	Oct 19, 2023	Common Sense ReasoningForm	CodeCode Available
The Box is in the Pen: Evaluating Commonsense Reasoning in Neural Machine Translation	Mar 5, 2025	Common Sense ReasoningMachine Translation	CodeCode Available
Deep contextualized word representations for detecting sarcasm and irony	Sep 26, 2018	Common Sense Reasoning	CodeCode Available
Recognition of Sarcasms in Tweets Based on Concept Level Sentiment Analysis and Supervised Learning Approaches	Dec 1, 2014	Common Sense ReasoningInformation Retrieval	CodeCode Available
Garbage in, garbage out: Zero-shot detection of crime using Large Language Models	Jul 4, 2023	Common Sense ReasoningLanguage Modeling	CodeCode Available
Declarative Reasoning on Explanations Using Constraint Logic Programming	Sep 1, 2023	Common Sense Reasoning	CodeCode Available
Unsupervised Learning from Continuous Video in a Scalable Predictive Recurrent Network	Jul 22, 2016	Common Sense ReasoningVisual Tracking	CodeCode Available
Unveiling LLMs: The Evolution of Latent Representations in a Dynamic Knowledge Graph	Apr 4, 2024	Claim VerificationCommon Sense Reasoning	CodeCode Available
DCQA: Document-Level Chart Question Answering towards Complex Reasoning and Common-Sense Understanding	Oct 29, 2023	Answer GenerationChart Question Answering	CodeCode Available
Muppet: Massive Multi-task Representations with Pre-Finetuning	Jan 26, 2021	Abstractive Text SummarizationCommon Sense Reasoning	CodeCode Available
Frame- and Entity-Based Knowledge for Common-Sense Argumentative Reasoning	Nov 1, 2018	Argument MiningCommon Sense Reasoning	CodeCode Available
CS-NET at SemEval-2020 Task 4: Siamese BERT for ComVE	Jul 21, 2020	Common Sense Reasoning	CodeCode Available
My Teacher Thinks The World Is Flat! Interpreting Automatic Essay Scoring Mechanism	Dec 27, 2020	Common Sense ReasoningNatural Language Understanding	CodeCode Available
CrossCat: A Fully Bayesian Nonparametric Method for Analyzing Heterogeneous, High Dimensional Data	Dec 3, 2015	Bayesian InferenceCommon Sense Reasoning	CodeCode Available
Learning to Predict Concept Ordering for Common Sense Generation	Sep 12, 2023	Common Sense ReasoningSentence	CodeCode Available
A Content-Based Novelty Measure for Scholarly Publications: A Proof of Concept	Jan 8, 2024	Common Sense ReasoningLanguage Modeling	CodeCode Available
A surprisal oracle for when every layer counts	Dec 4, 2024	Common Sense ReasoningLanguage Modeling	CodeCode Available
AlignedCoT: Prompting Large Language Models via Native-Speaking Demonstrations	Nov 22, 2023	Common Sense ReasoningGSM8K	CodeCode Available
Visual Coreference Resolution in Visual Dialog using Neural Module Networks	Sep 6, 2018	Common Sense Reasoningcoreference-resolution	CodeCode Available
FLIP Reasoning Challenge	Apr 16, 2025	Common Sense Reasoningimage-classification	CodeCode Available
Relational Neural Expectation Maximization: Unsupervised Discovery of Objects and their Interactions	Feb 28, 2018	Common Sense Reasoning	CodeCode Available
Correcting Contradictions	Jan 1, 2017	Common Sense ReasoningNatural Language Inference	CodeCode Available
Fine-tuning Pre-Trained Transformer Language Models to Distantly Supervised Relation Extraction	Jun 19, 2019	Common Sense ReasoningLanguage Modelling	CodeCode Available
The Knowref Coreference Corpus: Removing Gender and Number Cues for Difficult Pronominal Anaphora Resolution	Nov 2, 2018	Common Sense Reasoningcoreference-resolution	CodeCode Available
CITE: A Corpus of Image-Text Discourse Relations	Apr 12, 2019	Common Sense Reasoning	CodeCode Available
From Recognition to Prediction: Leveraging Sequence Reasoning for Action Anticipation	Aug 5, 2024	Action AnticipationAction Recognition	CodeCode Available
The Interplay between Lexical Resources and Natural Language Processing	Jul 2, 2018	Common Sense Reasoning	CodeCode Available
PaCo: Preconditions Attributed to Commonsense Knowledge	Apr 18, 2021	Common Sense Reasoning	CodeCode Available
Fact-and-Reflection (FaR) Improves Confidence Calibration of Large Language Models	Feb 27, 2024	Common Sense ReasoningQuestion Answering	CodeCode Available
Zero-Shot Information Extraction to Enhance a Knowledge Graph Describing Silk Textiles	Nov 1, 2021	Common Sense ReasoningKnowledge Graphs	CodeCode Available
Visual Question Answering using Deep Learning: A Survey and Performance Analysis	Aug 27, 2019	Common Sense ReasoningQuestion Answering	CodeCode Available
CORECODE: A Common Sense Annotated Dialogue Dataset with Benchmark Tasks for Chinese Large Language Models	Dec 20, 2023	Causal InferenceCommon Sense Reasoning	CodeCode Available
How Reasonable are Common-Sense Reasoning Tasks: A Case-Study on the Winograd Schema Challenge and SWAG	Nov 5, 2018	Common Sense ReasoningCoreference Resolution	CodeCode Available

Show:10 25 50

← PrevPage 19 of 19Next →

All datasets WinoGrande arc_challenge arc_easy ReCoRD CommonsenseQA PARus RuCoS RWSD BIG-bench (Causal Judgment)BIG-bench (Date Understanding)BIG-bench (Disambiguation QA)BIG-bench (Sports Understanding)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ST-MoE-32B 269B (fine-tuned)	Accuracy	96.1	—	Unverified
2	Unicorn 11B (fine-tuned)	Accuracy	91.3	—	Unverified
3	CompassMTL 567M with Tailor	Accuracy	90.5	—	Unverified
4	CompassMTL 567M	Accuracy	89.6	—	Unverified
5	UnifiedQA 11B (fine-tuned)	Accuracy	89.4	—	Unverified
6	Claude 3 Opus (5-shot)	Accuracy	88.5	—	Unverified
7	GPT-4 (5-shot)	Accuracy	87.5	—	Unverified
8	ExDeBERTa 567M	Accuracy	87	—	Unverified
9	LLaMA-2 13B + MixLoRA	Accuracy	86.3	—	Unverified
10	LLaMA3 8B+MoSLoRA	Accuracy	85.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 (few-shot, k=25)	Accuracy	96.4	—	Unverified
2	PaLM 2 (few-shot, CoT, SC)	Accuracy	95.1	—	Unverified
3	Shivaay (4B, few-shot, k=8)	Accuracy	91.04	—	Unverified
4	StupidLLM	Accuracy	91.03	—	Unverified
5	Claude 2 (few-shot, k=5)	Accuracy	91	—	Unverified
6	Claude 1.3 (few-shot, k=5)	Accuracy	90	—	Unverified
7	PaLM 540B (Self Improvement, Self Consistency)	Accuracy	89.8	—	Unverified
8	PaLM 540B (Self Consistency)	Accuracy	88.7	—	Unverified
9	PaLM 540B (Self Improvement, CoT Prompting)	Accuracy	88.3	—	Unverified
10	PaLM 540B (Self Improvement, Standard-Prompting)	Accuracy	87.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ST-MoE-32B 269B (fine-tuned)	Accuracy	95.2	—	Unverified
2	LLaMA 3 8B+MoSLoRA (fine-tuned)	Accuracy	90.5	—	Unverified
3	PaLM 2-L (1-shot)	Accuracy	89.7	—	Unverified
4	PaLM 2-M (1-shot)	Accuracy	88	—	Unverified
5	LLaMA-3 8B + MixLoRA	Accuracy	86.5	—	Unverified
6	Camelidae-8×34B	Accuracy	86.2	—	Unverified
7	PaLM 2-S (1-shot)	Accuracy	85.6	—	Unverified
8	LLaMA 65B + CFG (0-shot)	Accuracy	84.2	—	Unverified
9	GAL 120B (0-shot)	Accuracy	83.8	—	Unverified
10	LLaMA-2 13B + MixLoRA	Accuracy	83.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Turing NLR v5 XXL 5.4B (fine-tuned)	EM	95.9	—	Unverified
2	ST-MoE-32B 269B (fine-tuned)	EM	95.1	—	Unverified
3	T5-11B	F1	94.1	—	Unverified
4	DeBERTa-1.5B	EM	94.1	—	Unverified
5	PaLM 540B (finetuned)	EM	94	—	Unverified
6	Vega v2 6B (fine-tuned)	EM	93.9	—	Unverified
7	PaLM 2-L (one-shot)	F1	93.8	—	Unverified
8	T5-XXL 11B (fine-tuned)	EM	93.4	—	Unverified
9	PaLM 2-M (one-shot)	F1	92.4	—	Unverified
10	PaLM 2-S (one-shot)	F1	92.1	—	Unverified