Common Sense Reasoning

Common sense reasoning tasks are intended to require the model to go beyond pattern recognition. Instead, the model should use "common sense" or world knowledge to make inferences.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 751–800 of 939 papers

Title	Date	Tasks	Status	Hype
pair2vec: Compositional Word-Pair Embeddings for Cross-Sentence Inference	Oct 20, 2018	Common Sense ReasoningSentence	CodeCode Available	1
Machine Common Sense Concept Paper	Oct 17, 2018	Common Sense Reasoning	—Unverified	0
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding	Oct 11, 2018	Citation Intent ClassificationCommon Sense Reasoning	CodeCode Available	3
Towards Robot-Centric Conceptual Knowledge Acquisition	Oct 8, 2018	Common Sense Reasoning	—Unverified	0
A Knowledge Hunting Framework for Common Sense Reasoning	Oct 2, 2018	Common Sense ReasoningCoreference Resolution	—Unverified	0
HGSGNLP at IEST 2018: An Ensemble of Machine Learning and Deep Neural Architectures for Implicit Emotion Classification in Tweets	Oct 1, 2018	Common Sense ReasoningEmotion Classification	—Unverified	0
An Interpretable Neural Network with Topical Information for Relevant Emotion Ranking	Oct 1, 2018	Common Sense ReasoningEmotion Classification	—Unverified	0
Deep contextualized word representations for detecting sarcasm and irony	Sep 26, 2018	Common Sense Reasoning	CodeCode Available	0
Visual Coreference Resolution in Visual Dialog using Neural Module Networks	Sep 6, 2018	Common Sense Reasoningcoreference-resolution	CodeCode Available	0
Affordance Extraction and Inference based on Semantic Role Labeling	Sep 3, 2018	Common Sense ReasoningSemantic Role Labeling	—Unverified	0
Neural Task Planning with And-Or Graph Representations	Aug 25, 2018	Common Sense ReasoningTask Planning	—Unverified	0
Inductive Learning of Answer Set Programs from Noisy Examples	Aug 25, 2018	Common Sense ReasoningInductive Learning	—Unverified	0
SWAG: A Large-Scale Adversarial Dataset for Grounded Commonsense Inference	Aug 16, 2018	Common Sense ReasoningMultiple-choice	—Unverified	0
A Multi-Attention based Neural Network with External Knowledge for Story Ending Predicting Task	Aug 1, 2018	Common Sense ReasoningFeature Engineering	—Unverified	0
The Interplay between Lexical Resources and Natural Language Processing	Jul 2, 2018	Common Sense Reasoning	CodeCode Available	0
SocialNLP 2018 EmotionX Challenge Overview: Recognizing Emotions in Dialogues	Jul 1, 2018	Common Sense ReasoningEmotion Recognition	—Unverified	0
Systematic Error Analysis of the Stanford Question Answering Dataset	Jul 1, 2018	Common Sense ReasoningMachine Reading Comprehension	—Unverified	0
Extracting Commonsense Properties from Embeddings with Limited Human Guidance	Jul 1, 2018	Active LearningCommon Sense Reasoning	CodeCode Available	0
Modeling Sentiment Association in Discourse for Humor Recognition	Jul 1, 2018	Common Sense ReasoningSentiment Analysis	—Unverified	0
Incorporating Chinese Characters of Words for Lexical Sememe Prediction	Jun 17, 2018	Common Sense ReasoningPrediction	CodeCode Available	0
A Simple Method for Commonsense Reasoning	Jun 7, 2018	Common Sense ReasoningCoreference Resolution	CodeCode Available	0
Computational Argumentation: A Journey Beyond Semantics, Logic, Opinions, and Easy Tasks	Jun 1, 2018	Common Sense Reasoning	—Unverified	0
BLCU\_NLP at SemEval-2018 Task 12: An Ensemble Model for Argument Reasoning Based on Hierarchical Attention	Jun 1, 2018	Common Sense ReasoningWord Embeddings	—Unverified	0
TakeLab at SemEval-2018 Task12: Argument Reasoning Comprehension with Skip-Thought Vectors	Jun 1, 2018	Common Sense ReasoningNatural Language Inference	—Unverified	0
GIST at SemEval-2018 Task 12: A network transferring inference knowledge to Argument Reasoning Comprehension task	Jun 1, 2018	Common Sense ReasoningNatural Language Inference	CodeCode Available	0
MITRE at SemEval-2018 Task 11: Commonsense Reasoning without Commonsense Knowledge	Jun 1, 2018	Common Sense ReasoningInformation Retrieval	—Unverified	0
MIT-MEDG at SemEval-2018 Task 7: Semantic Relation Classification via Convolution Neural Network	Jun 1, 2018	ArticlesCommon Sense Reasoning	—Unverified	0
SemEval-2018 Task 12: The Argument Reasoning Comprehension Task	Jun 1, 2018	Common Sense Reasoning	—Unverified	0
CSReader at SemEval-2018 Task 11: Multiple Choice Question Answering as Textual Entailment	Jun 1, 2018	Common Sense ReasoningLanguage Modelling	—Unverified	0
A Generalized Knowledge Hunting Framework for the Winograd Schema Challenge	Jun 1, 2018	Common Sense ReasoningCoreference Resolution	—Unverified	0
Multimodal Frame Identification with Multilingual Evaluation	Jun 1, 2018	Common Sense ReasoningSemantic Role Labeling	—Unverified	0
Stacking with Auxiliary Features for Visual Question Answering	Jun 1, 2018	Common Sense ReasoningQuestion Answering	—Unverified	0
Visual Relationship Detection Based on Guided Proposals and Semantic Knowledge Distillation	May 28, 2018	Common Sense ReasoningKnowledge Distillation	—Unverified	0
VisualBackProp for learning using privileged information with CNNs	May 24, 2018	Autonomous DrivingBIG-bench Machine Learning	—Unverified	0
Event2Mind: Commonsense Inference on Events, Intents, and Reactions	May 17, 2018	Common Sense ReasoningDecoder	—Unverified	0
Extended HowNet 2.0 -- An Entity-Relation Common-Sense Representation Model	May 1, 2018	Common Sense ReasoningInformation Retrieval	—Unverified	0
A vision-grounded dataset for predicting typical locations for verbs	May 1, 2018	Common Sense ReasoningImage Captioning	—Unverified	0
A Danish FrameNet Lexicon and an Annotated Corpus Used for Training and Evaluating a Semantic Frame Classifier	May 1, 2018	Common Sense Reasoning	—Unverified	0
JFCKB: Japanese Feature Change Knowledge Base	May 1, 2018	Common Sense Reasoning	—Unverified	0
Tilde MT Platform for Developing Client Specific MT Solutions	May 1, 2018	Common Sense ReasoningMachine Translation	—Unverified	0
Comprehensive Annotation of Various Types of Temporal Information on the Time Axis	May 1, 2018	Common Sense Reasoning	—Unverified	0
Towards Symbolic Reinforcement Learning with Common Sense	Apr 23, 2018	Common Sense ReasoningDeep Reinforcement Learning	CodeCode Available	0
DOCK: Detecting Objects by transferring Common-sense Knowledge	Apr 3, 2018	AttributeCommon Sense Reasoning	—Unverified	0
Empirical Analysis of Foundational Distinctions in Linked Open Data	Mar 26, 2018	Common Sense ReasoningNatural Language Understanding	CodeCode Available	0
The Collision of Quality and Technology with Reality	Mar 1, 2018	Common Sense Reasoning	—Unverified	0
Fine-grained evaluation of Quality Estimation for Machine translation based on a linguistically motivated Test Suite	Mar 1, 2018	Automatic Post-EditingCommon Sense Reasoning	—Unverified	0
Augmented Translation: A New Approach to Combining Human and Machine Capabilities	Mar 1, 2018	Common Sense ReasoningTranslation	—Unverified	0
Relational Neural Expectation Maximization: Unsupervised Discovery of Objects and their Interactions	Feb 28, 2018	Common Sense Reasoning	CodeCode Available	0
Semantic Vector Spaces for Broadening Consideration of Consequences	Feb 23, 2018	Common Sense Reasoning	—Unverified	0
DKN: Deep Knowledge-Aware Network for News Recommendation	Jan 25, 2018	Click-Through Rate PredictionCommon Sense Reasoning	CodeCode Available	0

Show:10 25 50

← PrevPage 16 of 19Next →

All datasets WinoGrande arc_challenge arc_easy ReCoRD CommonsenseQA PARus RuCoS RWSD BIG-bench (Causal Judgment)BIG-bench (Date Understanding)BIG-bench (Disambiguation QA)BIG-bench (Sports Understanding)

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ST-MoE-32B 269B (fine-tuned)	Accuracy	96.1	—	Unverified
2	Unicorn 11B (fine-tuned)	Accuracy	91.3	—	Unverified
3	CompassMTL 567M with Tailor	Accuracy	90.5	—	Unverified
4	CompassMTL 567M	Accuracy	89.6	—	Unverified
5	UnifiedQA 11B (fine-tuned)	Accuracy	89.4	—	Unverified
6	Claude 3 Opus (5-shot)	Accuracy	88.5	—	Unverified
7	GPT-4 (5-shot)	Accuracy	87.5	—	Unverified
8	ExDeBERTa 567M	Accuracy	87	—	Unverified
9	LLaMA-2 13B + MixLoRA	Accuracy	86.3	—	Unverified
10	LLaMA3 8B+MoSLoRA	Accuracy	85.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 (few-shot, k=25)	Accuracy	96.4	—	Unverified
2	PaLM 2 (few-shot, CoT, SC)	Accuracy	95.1	—	Unverified
3	Shivaay (4B, few-shot, k=8)	Accuracy	91.04	—	Unverified
4	StupidLLM	Accuracy	91.03	—	Unverified
5	Claude 2 (few-shot, k=5)	Accuracy	91	—	Unverified
6	Claude 1.3 (few-shot, k=5)	Accuracy	90	—	Unverified
7	PaLM 540B (Self Improvement, Self Consistency)	Accuracy	89.8	—	Unverified
8	PaLM 540B (Self Consistency)	Accuracy	88.7	—	Unverified
9	PaLM 540B (Self Improvement, CoT Prompting)	Accuracy	88.3	—	Unverified
10	PaLM 540B (Self Improvement, Standard-Prompting)	Accuracy	87.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ST-MoE-32B 269B (fine-tuned)	Accuracy	95.2	—	Unverified
2	LLaMA 3 8B+MoSLoRA (fine-tuned)	Accuracy	90.5	—	Unverified
3	PaLM 2-L (1-shot)	Accuracy	89.7	—	Unverified
4	PaLM 2-M (1-shot)	Accuracy	88	—	Unverified
5	LLaMA-3 8B + MixLoRA	Accuracy	86.5	—	Unverified
6	Camelidae-8×34B	Accuracy	86.2	—	Unverified
7	PaLM 2-S (1-shot)	Accuracy	85.6	—	Unverified
8	LLaMA 65B + CFG (0-shot)	Accuracy	84.2	—	Unverified
9	GAL 120B (0-shot)	Accuracy	83.8	—	Unverified
10	LLaMA-2 13B + MixLoRA	Accuracy	83.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Turing NLR v5 XXL 5.4B (fine-tuned)	EM	95.9	—	Unverified
2	ST-MoE-32B 269B (fine-tuned)	EM	95.1	—	Unverified
3	T5-11B	F1	94.1	—	Unverified
4	DeBERTa-1.5B	EM	94.1	—	Unverified
5	PaLM 540B (finetuned)	EM	94	—	Unverified
6	Vega v2 6B (fine-tuned)	EM	93.9	—	Unverified
7	PaLM 2-L (one-shot)	F1	93.8	—	Unverified
8	T5-XXL 11B (fine-tuned)	EM	93.4	—	Unverified
9	PaLM 2-M (one-shot)	F1	92.4	—	Unverified
10	PaLM 2-S (one-shot)	F1	92.1	—	Unverified