Common Sense Reasoning

Common sense reasoning tasks are intended to require the model to go beyond pattern recognition. Instead, the model should use "common sense" or world knowledge to make inferences.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 501–550 of 939 papers

Title	Date	Tasks	Status
COMMA-DEER: COmmon-sense Aware Multimodal Multitask Approach for Detection of Emotion and Emotional Reasoning in Conversations	Oct 1, 2022	Common Sense Reasoning	—Unverified
KC-ISA: An Implicit Sentiment Analysis Model Combining Knowledge Enhancement and Context Features	Oct 1, 2022	Common Sense ReasoningSentiment Analysis	CodeCode Available
Do ever larger octopi still amplify reporting biases? Evidence from judgments of typical colour	Sep 26, 2022	Common Sense ReasoningPhysical Commonsense Reasoning	—Unverified
Decentralized Vehicle Coordination: The Berkeley DeepDrive Drone Dataset and Consensus-Based Models	Sep 19, 2022	Collision AvoidanceCommon Sense Reasoning	—Unverified
ERNIE-mmLayout: Multi-grained MultiModal Transformer for Document Understanding	Sep 18, 2022	Common Sense Reasoningdocument understanding	—Unverified
Assessment of cognitive characteristics in intelligent systems and predictive ability	Sep 16, 2022	Common Sense Reasoning	—Unverified
The Embeddings World and Artificial General Intelligence	Sep 14, 2022	Common Sense Reasoning	—Unverified
Elaboration-Generating Commonsense Question Answering at Scale	Sep 2, 2022	Common Sense ReasoningQuestion Answering	CodeCode Available
JARVIS: A Neuro-Symbolic Commonsense Reasoning Framework for Conversational Embodied Agents	Aug 28, 2022	Action GenerationCommon Sense Reasoning	—Unverified
On Reality and the Limits of Language Data: Aligning LLMs with Human Norms	Aug 25, 2022	Common Sense Reasoning	—Unverified
Exploiting Sentiment and Common Sense for Zero-shot Stance Detection	Aug 18, 2022	Common Sense ReasoningStance Detection	CodeCode Available
Intrinsically Motivated Learning of Causal World Models	Aug 9, 2022	Common Sense Reasoningreinforcement-learning	—Unverified
Neuro-Symbolic Learning: Principles and Applications in Ophthalmology	Jul 31, 2022	Common Sense ReasoningImage Captioning	—Unverified
PASTA: A Dataset for Modeling Participant States in Narratives	Jul 31, 2022	BenchmarkingCommon Sense Reasoning	—Unverified
WinoGAViL: Gamified Association Benchmark to Challenge Vision-and-Language Models	Jul 25, 2022	Common Sense ReasoningGeneral Knowledge	CodeCode Available
V-Coder: Adaptive AutoEncoder for Semantic Disclosure in Knowledge Graphs	Jul 22, 2022	Common Sense ReasoningDisentanglement	—Unverified
Reasoning about Actions over Visual and Linguistic Modalities: A Survey	Jul 15, 2022	Common Sense ReasoningSurvey	—Unverified
Ask Me What You Need: Product Retrieval using Knowledge from GPT-3	Jul 6, 2022	Common Sense ReasoningQuestion Answering	—Unverified
A Systematic Survey of Text Worlds as Embodied Natural Language Environments	Jul 1, 2022	Common Sense ReasoningKnowledge Graphs	—Unverified
Is “My Favorite New Movie” My Favorite Movie? Probing the Understanding of Recursive Noun Phrases	Jul 1, 2022	Common Sense ReasoningNatural Language Inference	—Unverified
0/1 Deep Neural Networks via Block Coordinate Descent	Jun 19, 2022	10-shot image generation	—Unverified
Symbolic image detection using scene and knowledge graphs	Jun 10, 2022	Common Sense ReasoningKnowledge Graphs	CodeCode Available
Extracting Zero-shot Common Sense from Large Language Models for Robot 3D Scene Understanding	Jun 9, 2022	Common Sense ReasoningScene Understanding	—Unverified
RELATE: Generating a linguistically inspired Knowledge Graph for fine-grained emotion classification	Jun 1, 2022	Common Sense ReasoningEmotion Classification	—Unverified
Towards the Detection of a Semantic Gap in the Chain of Commonsense Knowledge Triples	Jun 1, 2022	Common Sense ReasoningLanguage Modeling	—Unverified
An Informational Space Based Semantic Analysis for Scientific Texts	May 31, 2022	Common Sense Reasoning	—Unverified
Leveraging QA Datasets to Improve Generative Data Augmentation	May 25, 2022	Common Sense ReasoningData Augmentation	CodeCode Available
A Survey on Semantics in Automated Data Science	May 16, 2022	BIG-bench Machine LearningCommon Sense Reasoning	—Unverified
Identifying relevant common sense information in knowledge graphs	May 1, 2022	Common Sense ReasoningKnowledge Graphs	CodeCode Available
Detecting COVID-19 Conspiracy Theories with Transformers and TF-IDF	May 1, 2022	Common Sense ReasoningFake News Detection	—Unverified
Irony Detection for Dutch: a Venture into the Implicit	May 1, 2022	Common Sense Reasoning	—Unverified
Trans-KBLSTM: An External Knowledge Enhanced Transformer BiLSTM Model for Tabular Reasoning	May 1, 2022	Common Sense ReasoningNatural Language Inference	—Unverified
On the Limitations of Dataset Balancing: The Lost Battle Against Spurious Correlations	Apr 27, 2022	Common Sense ReasoningWorld Knowledge	—Unverified
A very preliminary analysis of DALL-E 2	Apr 25, 2022	Common Sense Reasoning	—Unverified
Deep Unsupervised Hashing with Latent Semantic Components	Mar 17, 2022	Common Sense ReasoningImage Retrieval	—Unverified
K-VQG: Knowledge-aware Visual Question Generation for Common-sense Acquisition	Mar 15, 2022	Common Sense ReasoningQuestion Generation	—Unverified
Efficient Language Modeling with Sparse all-MLP	Mar 14, 2022	AllCommon Sense Reasoning	—Unverified
Embarrassingly Simple Performance Prediction for Abductive Natural Language Inference	Feb 21, 2022	Common Sense ReasoningModel Selection	CodeCode Available
Integration of knowledge and data in machine learning	Feb 15, 2022	BIG-bench Machine LearningCommon Sense Reasoning	—Unverified
Russian SuperGLUE 1.1: Revising the Lessons not Learned by Russian NLP models	Feb 15, 2022	Common Sense ReasoningReading Comprehension	—Unverified
Neural NID Rules	Feb 12, 2022	Common Sense ReasoningGraph Neural Network	—Unverified
NEWSKVQA: Knowledge-Aware News Video Question Answering	Feb 8, 2022	Common Sense ReasoningManagement	—Unverified
An Application of Pseudo-Log-Likelihoods to Natural Language Scoring	Jan 23, 2022	Common Sense ReasoningGPU	—Unverified
Evaluating Machine Common Sense via Cloze Testing	Jan 19, 2022	Common Sense ReasoningOpen-Ended Question Answering	—Unverified
COPA-SSE: Semi-structured Explanations for Commonsense Reasoning	Jan 18, 2022	Common Sense ReasoningKnowledge Graphs	CodeCode Available
Combining Fast and Slow Thinking for Human-like and Efficient Navigation in Constrained Environments	Jan 18, 2022	Common Sense ReasoningDecision Making	—Unverified
On the Limitations of Dataset Balancing: The Lost Battle Against Spurious Correlations	Jan 16, 2022	Common Sense ReasoningWorld Knowledge	—Unverified
Unsupervised Common Sense Relation Extraction	Jan 16, 2022	Common Sense ReasoningRelation	—Unverified
CommonsenseQA 2.0: Exposing the Limits of AI through Gamification	Jan 14, 2022	Common Sense ReasoningNatural Language Understanding	—Unverified
Towards Automated Error Analysis: Learning to Characterize Errors	Jan 13, 2022	Common Sense ReasoningMeta-Learning	—Unverified

Show:10 25 50

← PrevPage 11 of 19Next →

All datasets WinoGrande arc_challenge arc_easy ReCoRD CommonsenseQA PARus RuCoS RWSD BIG-bench (Causal Judgment)BIG-bench (Date Understanding)BIG-bench (Disambiguation QA)BIG-bench (Sports Understanding)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ST-MoE-32B 269B (fine-tuned)	Accuracy	96.1	—	Unverified
2	Unicorn 11B (fine-tuned)	Accuracy	91.3	—	Unverified
3	CompassMTL 567M with Tailor	Accuracy	90.5	—	Unverified
4	CompassMTL 567M	Accuracy	89.6	—	Unverified
5	UnifiedQA 11B (fine-tuned)	Accuracy	89.4	—	Unverified
6	Claude 3 Opus (5-shot)	Accuracy	88.5	—	Unverified
7	GPT-4 (5-shot)	Accuracy	87.5	—	Unverified
8	ExDeBERTa 567M	Accuracy	87	—	Unverified
9	LLaMA-2 13B + MixLoRA	Accuracy	86.3	—	Unverified
10	LLaMA3 8B+MoSLoRA	Accuracy	85.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 (few-shot, k=25)	Accuracy	96.4	—	Unverified
2	PaLM 2 (few-shot, CoT, SC)	Accuracy	95.1	—	Unverified
3	Shivaay (4B, few-shot, k=8)	Accuracy	91.04	—	Unverified
4	StupidLLM	Accuracy	91.03	—	Unverified
5	Claude 2 (few-shot, k=5)	Accuracy	91	—	Unverified
6	Claude 1.3 (few-shot, k=5)	Accuracy	90	—	Unverified
7	PaLM 540B (Self Improvement, Self Consistency)	Accuracy	89.8	—	Unverified
8	PaLM 540B (Self Consistency)	Accuracy	88.7	—	Unverified
9	PaLM 540B (Self Improvement, CoT Prompting)	Accuracy	88.3	—	Unverified
10	PaLM 540B (Self Improvement, Standard-Prompting)	Accuracy	87.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ST-MoE-32B 269B (fine-tuned)	Accuracy	95.2	—	Unverified
2	LLaMA 3 8B+MoSLoRA (fine-tuned)	Accuracy	90.5	—	Unverified
3	PaLM 2-L (1-shot)	Accuracy	89.7	—	Unverified
4	PaLM 2-M (1-shot)	Accuracy	88	—	Unverified
5	LLaMA-3 8B + MixLoRA	Accuracy	86.5	—	Unverified
6	Camelidae-8×34B	Accuracy	86.2	—	Unverified
7	PaLM 2-S (1-shot)	Accuracy	85.6	—	Unverified
8	LLaMA 65B + CFG (0-shot)	Accuracy	84.2	—	Unverified
9	GAL 120B (0-shot)	Accuracy	83.8	—	Unverified
10	LLaMA-2 13B + MixLoRA	Accuracy	83.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Turing NLR v5 XXL 5.4B (fine-tuned)	EM	95.9	—	Unverified
2	ST-MoE-32B 269B (fine-tuned)	EM	95.1	—	Unverified
3	T5-11B	F1	94.1	—	Unverified
4	DeBERTa-1.5B	EM	94.1	—	Unverified
5	PaLM 540B (finetuned)	EM	94	—	Unverified
6	Vega v2 6B (fine-tuned)	EM	93.9	—	Unverified
7	PaLM 2-L (one-shot)	F1	93.8	—	Unverified
8	T5-XXL 11B (fine-tuned)	EM	93.4	—	Unverified
9	PaLM 2-M (one-shot)	F1	92.4	—	Unverified
10	PaLM 2-S (one-shot)	F1	92.1	—	Unverified