Common Sense Reasoning

Common sense reasoning tasks are intended to require the model to go beyond pattern recognition. Instead, the model should use "common sense" or world knowledge to make inferences.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 851–900 of 939 papers

Title	Date	Tasks	Status
Computing Sentiment Scores of Verb Phrases for Vietnamese	Oct 1, 2016	Common Sense ReasoningMachine Translation	—Unverified
Good Automatic Authentication Question Generation	Sep 1, 2016	Common Sense ReasoningDependency Parsing	—Unverified
Content selection as semantic-based ontology exploration	Sep 1, 2016	Common Sense ReasoningText Generation	—Unverified
A Discourse-Annotated Corpus of Conjoined VPs	Aug 1, 2016	Common Sense ReasoningMachine Translation	—Unverified
Event Embeddings for Semantic Script Modeling	Aug 1, 2016	Common Sense Reasoning	—Unverified
Improving Text-to-Pictograph Translation Through Word Sense Disambiguation	Aug 1, 2016	Common Sense ReasoningTranslation	—Unverified
How Factuality Determines Sentiment Inferences	Aug 1, 2016	Common Sense Reasoning	—Unverified
Most ``babies'' are ``little'' and most ``problems'' are ``huge'': Compositional Entailment in Adjective-Nouns	Aug 1, 2016	Common Sense ReasoningNatural Language Inference	—Unverified
Learning Prototypical Event Structure from Photo Albums	Aug 1, 2016	ClusteringCommon Sense Reasoning	—Unverified
Unsupervised Learning from Continuous Video in a Scalable Predictive Recurrent Network	Jul 22, 2016	Common Sense ReasoningVisual Tracking	CodeCode Available
Sort Story: Sorting Jumbled Images and Captions into Stories	Jun 23, 2016	Common Sense ReasoningDocument Summarization	—Unverified
FVQA: Fact-based Visual Question Answering	Jun 17, 2016	Common Sense ReasoningQuestion Answering	—Unverified
Constructing a Dictionary Describing Feature Changes of Arguments in Event Sentences	Jun 1, 2016	Common Sense Reasoning	—Unverified
Regularizing Relation Representations by First-order Implications	Jun 1, 2016	Common Sense ReasoningNatural Language Inference	—Unverified
An Hymn of an even Deeper Sentiment Analysis	Jun 1, 2016	Common Sense ReasoningSemantic Role Labeling	—Unverified
The Physics of Text: Ontological Realism in Information Extraction	Jun 1, 2016	Common Sense ReasoningOpen Information Extraction	—Unverified
Towards Semantic-based Hybrid Machine Translation between Bulgarian and English	Jun 1, 2016	Common Sense ReasoningLanguage Modeling	—Unverified
Automatic Text Generation by Learning from Literary Structures	Jun 1, 2016	Common Sense ReasoningText Generation	—Unverified
Sentiment Analysis - What are we talking about?	Jun 1, 2016	Common Sense ReasoningSentiment Analysis	—Unverified
Stating the Obvious: Extracting Visual Common Sense Knowledge	Jun 1, 2016	Common Sense ReasoningObject Detection	—Unverified
Embedding Open-domain Common-sense Knowledge from Text	May 1, 2016	Common Sense ReasoningOpen Information Extraction	—Unverified
Automatic Enrichment of WordNet with Common-Sense Knowledge	May 1, 2016	Common Sense ReasoningWord Sense Disambiguation	—Unverified
Resolving Language and Vision Ambiguities Together: Joint Segmentation & Prepositional Attachment Resolution in Captioned Scenes	Apr 7, 2016	Common Sense ReasoningPrepositional Phrase Attachment	—Unverified
Geo-distinctive Visual Element Matching for Location Estimation of Images	Jan 28, 2016	Common Sense Reasoning	—Unverified
Forecasting Social Navigation in Crowded Complex Scenes	Jan 5, 2016	Common Sense ReasoningNavigate	—Unverified
Potential and Limits of Using Post-edits as Reference Translations for MT Evaluation	Jan 1, 2016	Common Sense ReasoningMachine Translation	—Unverified
Understanding Satirical Articles Using Common-Sense	Jan 1, 2016	ArticlesClassification	—Unverified
Collaborative Filtering for Predicting User Preferences for Organizing Objects	Dec 20, 2015	Collaborative FilteringCommon Sense Reasoning	—Unverified
CrossCat: A Fully Bayesian Nonparametric Method for Analyzing Heterogeneous, High Dimensional Data	Dec 3, 2015	Bayesian InferenceCommon Sense Reasoning	CodeCode Available
Semantic Segmentation of RGBD Images With Mutex Constraints	Dec 1, 2015	Common Sense ReasoningScene Labeling	—Unverified
Learning Common Sense Through Visual Abstraction	Dec 1, 2015	Common Sense Reasoning	—Unverified
Visual Word2Vec (vis-w2v): Learning Visually Grounded Word Embeddings Using Abstract Scenes	Nov 22, 2015	Common Sense ReasoningImage Retrieval	CodeCode Available
Reasoning in Vector Space: An Exploratory Study of Question Answering	Nov 19, 2015	Common Sense ReasoningLogical Reasoning	—Unverified
Modeling User Exposure in Recommendation	Oct 23, 2015	Collaborative FilteringCommon Sense Reasoning	CodeCode Available
The Computational Principles of Learning Ability	Sep 23, 2015	Common Sense Reasoning	—Unverified
Measuring an Artificial Intelligence System's Performance on a Verbal IQ Test For Young Children	Sep 11, 2015	Common Sense ReasoningQuestion Answering	—Unverified
Learning the Impact and Behavior of Syntactic Structure: A Case Study in Semantic Textual Similarity	Sep 1, 2015	Common Sense ReasoningSemantic Textual Similarity	—Unverified
Mise en Place: Unsupervised Interpretation of Instructional Recipes	Sep 1, 2015	Common Sense Reasoning	—Unverified
A Strong Lexical Matching Method for the Machine Comprehension Test	Sep 1, 2015	Common Sense ReasoningCoreference Resolution	—Unverified
Automatic Identification of Age-Appropriate Ratings of Song Lyrics	Jul 1, 2015	Common Sense ReasoningText Classification	—Unverified
A Neural Conversational Model	Jun 19, 2015	Common Sense Reasoningmodel	CodeCode Available
Distributional semantics for ontology verification	Jun 1, 2015	Common Sense Reasoning	—Unverified
Gaze-Enabled Egocentric Video Summarization via Constrained Submodular Maximization	Jun 1, 2015	Combinatorial OptimizationCommon Sense Reasoning	—Unverified
Trimming a consistent OWL knowledge base, relying on linguistic evidence	Apr 1, 2015	Common Sense Reasoning	—Unverified
Prepositional Phrase Attachment Problem Revisited: how Verbnet can Help	Apr 1, 2015	Common Sense ReasoningPrepositional Phrase Attachment	—Unverified
The RatioLog Project: Rational Extensions of Logical Reasoning	Mar 20, 2015	BIG-bench Machine LearningCommon Sense Reasoning	—Unverified
Don't Just Listen, Use Your Imagination: Leveraging Visual Common Sense for Non-Visual Tasks	Feb 21, 2015	Common Sense Reasoning	—Unverified
Recognition of Sarcasms in Tweets Based on Concept Level Sentiment Analysis and Supervised Learning Approaches	Dec 1, 2014	Common Sense ReasoningInformation Retrieval	CodeCode Available
Towards Learning Object Affordance Priors from Technical Texts	Oct 30, 2014	Common Sense ReasoningObject	—Unverified
Learning Spatial Knowledge for Text to 3D Scene Generation	Oct 1, 2014	Common Sense ReasoningScene Generation	—Unverified

Show:10 25 50

← PrevPage 18 of 19Next →

All datasets WinoGrande arc_challenge arc_easy ReCoRD CommonsenseQA PARus RuCoS RWSD BIG-bench (Causal Judgment)BIG-bench (Date Understanding)BIG-bench (Disambiguation QA)BIG-bench (Sports Understanding)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ST-MoE-32B 269B (fine-tuned)	Accuracy	96.1	—	Unverified
2	Unicorn 11B (fine-tuned)	Accuracy	91.3	—	Unverified
3	CompassMTL 567M with Tailor	Accuracy	90.5	—	Unverified
4	CompassMTL 567M	Accuracy	89.6	—	Unverified
5	UnifiedQA 11B (fine-tuned)	Accuracy	89.4	—	Unverified
6	Claude 3 Opus (5-shot)	Accuracy	88.5	—	Unverified
7	GPT-4 (5-shot)	Accuracy	87.5	—	Unverified
8	ExDeBERTa 567M	Accuracy	87	—	Unverified
9	LLaMA-2 13B + MixLoRA	Accuracy	86.3	—	Unverified
10	LLaMA3 8B+MoSLoRA	Accuracy	85.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 (few-shot, k=25)	Accuracy	96.4	—	Unverified
2	PaLM 2 (few-shot, CoT, SC)	Accuracy	95.1	—	Unverified
3	Shivaay (4B, few-shot, k=8)	Accuracy	91.04	—	Unverified
4	StupidLLM	Accuracy	91.03	—	Unverified
5	Claude 2 (few-shot, k=5)	Accuracy	91	—	Unverified
6	Claude 1.3 (few-shot, k=5)	Accuracy	90	—	Unverified
7	PaLM 540B (Self Improvement, Self Consistency)	Accuracy	89.8	—	Unverified
8	PaLM 540B (Self Consistency)	Accuracy	88.7	—	Unverified
9	PaLM 540B (Self Improvement, CoT Prompting)	Accuracy	88.3	—	Unverified
10	PaLM 540B (Self Improvement, Standard-Prompting)	Accuracy	87.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ST-MoE-32B 269B (fine-tuned)	Accuracy	95.2	—	Unverified
2	LLaMA 3 8B+MoSLoRA (fine-tuned)	Accuracy	90.5	—	Unverified
3	PaLM 2-L (1-shot)	Accuracy	89.7	—	Unverified
4	PaLM 2-M (1-shot)	Accuracy	88	—	Unverified
5	LLaMA-3 8B + MixLoRA	Accuracy	86.5	—	Unverified
6	Camelidae-8×34B	Accuracy	86.2	—	Unverified
7	PaLM 2-S (1-shot)	Accuracy	85.6	—	Unverified
8	LLaMA 65B + CFG (0-shot)	Accuracy	84.2	—	Unverified
9	GAL 120B (0-shot)	Accuracy	83.8	—	Unverified
10	LLaMA-2 13B + MixLoRA	Accuracy	83.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Turing NLR v5 XXL 5.4B (fine-tuned)	EM	95.9	—	Unverified
2	ST-MoE-32B 269B (fine-tuned)	EM	95.1	—	Unverified
3	T5-11B	F1	94.1	—	Unverified
4	DeBERTa-1.5B	EM	94.1	—	Unverified
5	PaLM 540B (finetuned)	EM	94	—	Unverified
6	Vega v2 6B (fine-tuned)	EM	93.9	—	Unverified
7	PaLM 2-L (one-shot)	F1	93.8	—	Unverified
8	T5-XXL 11B (fine-tuned)	EM	93.4	—	Unverified
9	PaLM 2-M (one-shot)	F1	92.4	—	Unverified
10	PaLM 2-S (one-shot)	F1	92.1	—	Unverified