Common Sense Reasoning

Common sense reasoning tasks are intended to require the model to go beyond pattern recognition. Instead, the model should use "common sense" or world knowledge to make inferences.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 901–939 of 939 papers

Title	Date	Tasks	Status
NaturalLI: Natural Logic Inference for Common Sense Reasoning	Oct 1, 2014	Common Sense Reasoning	—Unverified
The Case for a Mixed-Initiative Collaborative Neuroevolution Approach	Aug 5, 2014	Common Sense ReasoningGame Design	—Unverified
A Rule-Based Approach to Aspect Extraction from Product Reviews	Aug 1, 2014	Aspect ExtractionCommon Sense Reasoning	—Unverified
OPI: Semeval-2014 Task 3 System Description	Aug 1, 2014	Common Sense ReasoningSemantic Textual Similarity	—Unverified
Non-Monotonic Reasoning and Story Comprehension	Jul 14, 2014	Common Sense ReasoningReading Comprehension	—Unverified
Knowledge Acquisition Strategies for Goal-Oriented Dialog Systems	Jun 1, 2014	Common Sense ReasoningGoal-Oriented Dialog	—Unverified
Interactive Learning of Spatial Knowledge for Text to 3D Scene Generation	Jun 1, 2014	Common Sense ReasoningScene Generation	—Unverified
Context-based Natural Language Processing for GIS-based Vague Region Visualization	Jun 1, 2014	Common Sense ReasoningPart-Of-Speech Tagging	—Unverified
Semantic Parsing for Text to 3D Scene Generation	Jun 1, 2014	Common Sense ReasoningScene Generation	—Unverified
Inducing Neural Models of Script Knowledge	Jun 1, 2014	Common Sense ReasoningQuestion Answering	—Unverified
Open Information Extraction for Spanish Language based on Syntactic Constraints	Jun 1, 2014	Common Sense ReasoningOpen Information Extraction	—Unverified
Informed Haar-like Features Improve Pedestrian Detection	Jun 1, 2014	Common Sense ReasoningPedestrian Detection	—Unverified
Transliteration and alignment of parallel texts from Cyrillic to Latin	May 1, 2014	Common Sense ReasoningMachine Translation	—Unverified
Automatic semantic relation extraction from Portuguese texts	May 1, 2014	BIG-bench Machine LearningCommon Sense Reasoning	—Unverified
A Large Scale Database of Strongly-related Events in Japanese	May 1, 2014	Common Sense Reasoningcoreference-resolution	—Unverified
A Hierarchical Bayesian Model for Unsupervised Induction of Script Knowledge	Apr 1, 2014	Common Sense ReasoningQuestion Answering	—Unverified
Wikipedia-based Semantic Interpretation for Natural Language Processing	Jan 15, 2014	Common Sense ReasoningText Categorization	—Unverified
Using Web Co-occurrence Statistics for Improving Image Categorization	Dec 19, 2013	Common Sense ReasoningImage Categorization	—Unverified
Learning Semantic Script Knowledge with Event Embeddings	Dec 18, 2013	Common Sense Reasoning	—Unverified
Event Sequence Model for Semantic Analysis of Time and Location in Dialogue System	Nov 1, 2013	Common Sense Reasoning	—Unverified
Sweetening Ontologies cont'd	Nov 1, 2013	Common Sense Reasoning	—Unverified
A Logic-based Approach for Recognizing Textual Entailment Supported by Ontological Background Knowledge	Oct 18, 2013	Common Sense ReasoningNatural Language Inference	—Unverified
Combining PCFG-LA Models with Dual Decomposition: A Case Study with Function Labels and Binarization	Oct 1, 2013	BinarizationCommon Sense Reasoning	—Unverified
Features of Verb Complements in Co-composition: A case study of Chinese baking verb using Weibo corpus	Sep 1, 2013	Common Sense ReasoningWord Sense Disambiguation	—Unverified
Transforming the Data Transcription and Analysis Tool Metadata and Labels into a Linguistic Linked Open Data Cloud Resource	Sep 1, 2013	Common Sense ReasoningLanguage Acquisition	—Unverified
Toward a Better Understanding of Causality between Verbal Events: Extraction and Analysis of the Causal Power of Verb-Verb Associations	Aug 1, 2013	Common Sense Reasoning	—Unverified
Philosophers are Mortal: Inferring the Truth of Unseen Facts	Aug 1, 2013	Common Sense ReasoningMachine Translation	—Unverified
Using Conceptual Class Attributes to Characterize Social Media Users	Aug 1, 2013	Common Sense Reasoning	—Unverified
Is a 204 cm Man Tall or Small ? Acquisition of Numerical Common Sense from the Web	Aug 1, 2013	Common Sense ReasoningNatural Language Inference	—Unverified
Probabilistic and Non-Monotonic Inference	Mar 27, 2013	Common Sense ReasoningDecision Making	—Unverified
Some Extensions of Probabilistic Logic	Mar 27, 2013	Bayesian InferenceCommon Sense Reasoning	—Unverified
Towards common-sense reasoning via conditional simulation: legacies of Turing in Artificial Intelligence	Dec 19, 2012	Common Sense ReasoningPhilosophy	—Unverified
Markov Chains for Robust Graph-Based Commonsense Information Extraction	Dec 1, 2012	Common Sense Reasoning	—Unverified
Sentiment Analysis Using a Novel Human Computation Game	Jul 1, 2012	Common Sense ReasoningGame Design	—Unverified
Learning to ``Read Between the Lines'' using Bayesian Logic Programs	Jul 1, 2012	Common Sense ReasoningReading Comprehension	—Unverified
Towards Distributed MCMC Inference in Probabilistic Knowledge Bases	Jun 1, 2012	Common Sense Reasoning	—Unverified
Representing General Relational Knowledge in ConceptNet 5	May 1, 2012	Common Sense Reasoning	—Unverified
A Tool for Extracting Conversational Implicatures	May 1, 2012	Common Sense ReasoningImplicatures	—Unverified
Affective Common Sense Knowledge Acquisition for Sentiment Analysis	May 1, 2012	Common Sense ReasoningDecision Making	—Unverified

Show:10 25 50

← PrevPage 19 of 19Next →

All datasets WinoGrande arc_challenge arc_easy ReCoRD CommonsenseQA PARus RuCoS RWSD BIG-bench (Causal Judgment)BIG-bench (Date Understanding)BIG-bench (Disambiguation QA)BIG-bench (Sports Understanding)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ST-MoE-32B 269B (fine-tuned)	Accuracy	96.1	—	Unverified
2	Unicorn 11B (fine-tuned)	Accuracy	91.3	—	Unverified
3	CompassMTL 567M with Tailor	Accuracy	90.5	—	Unverified
4	CompassMTL 567M	Accuracy	89.6	—	Unverified
5	UnifiedQA 11B (fine-tuned)	Accuracy	89.4	—	Unverified
6	Claude 3 Opus (5-shot)	Accuracy	88.5	—	Unverified
7	GPT-4 (5-shot)	Accuracy	87.5	—	Unverified
8	ExDeBERTa 567M	Accuracy	87	—	Unverified
9	LLaMA-2 13B + MixLoRA	Accuracy	86.3	—	Unverified
10	LLaMA3 8B+MoSLoRA	Accuracy	85.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 (few-shot, k=25)	Accuracy	96.4	—	Unverified
2	PaLM 2 (few-shot, CoT, SC)	Accuracy	95.1	—	Unverified
3	Shivaay (4B, few-shot, k=8)	Accuracy	91.04	—	Unverified
4	StupidLLM	Accuracy	91.03	—	Unverified
5	Claude 2 (few-shot, k=5)	Accuracy	91	—	Unverified
6	Claude 1.3 (few-shot, k=5)	Accuracy	90	—	Unverified
7	PaLM 540B (Self Improvement, Self Consistency)	Accuracy	89.8	—	Unverified
8	PaLM 540B (Self Consistency)	Accuracy	88.7	—	Unverified
9	PaLM 540B (Self Improvement, CoT Prompting)	Accuracy	88.3	—	Unverified
10	PaLM 540B (Self Improvement, Standard-Prompting)	Accuracy	87.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ST-MoE-32B 269B (fine-tuned)	Accuracy	95.2	—	Unverified
2	LLaMA 3 8B+MoSLoRA (fine-tuned)	Accuracy	90.5	—	Unverified
3	PaLM 2-L (1-shot)	Accuracy	89.7	—	Unverified
4	PaLM 2-M (1-shot)	Accuracy	88	—	Unverified
5	LLaMA-3 8B + MixLoRA	Accuracy	86.5	—	Unverified
6	Camelidae-8×34B	Accuracy	86.2	—	Unverified
7	PaLM 2-S (1-shot)	Accuracy	85.6	—	Unverified
8	LLaMA 65B + CFG (0-shot)	Accuracy	84.2	—	Unverified
9	GAL 120B (0-shot)	Accuracy	83.8	—	Unverified
10	LLaMA-2 13B + MixLoRA	Accuracy	83.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Turing NLR v5 XXL 5.4B (fine-tuned)	EM	95.9	—	Unverified
2	ST-MoE-32B 269B (fine-tuned)	EM	95.1	—	Unverified
3	T5-11B	F1	94.1	—	Unverified
4	DeBERTa-1.5B	EM	94.1	—	Unverified
5	PaLM 540B (finetuned)	EM	94	—	Unverified
6	Vega v2 6B (fine-tuned)	EM	93.9	—	Unverified
7	PaLM 2-L (one-shot)	F1	93.8	—	Unverified
8	T5-XXL 11B (fine-tuned)	EM	93.4	—	Unverified
9	PaLM 2-M (one-shot)	F1	92.4	—	Unverified
10	PaLM 2-S (one-shot)	F1	92.1	—	Unverified