Natural Language Inference

Natural language inference (NLI) is the task of determining whether a "hypothesis" is true (entailment), false (contradiction), or undetermined (neutral) given a "premise".

Example:

| Premise | Label | Hypothesis | | --- | ---| --- | | A man inspects the uniform of a figure in some East Asian country. | contradiction | The man is sleeping. | | An older and younger man smiling. | neutral | Two men are smiling and laughing at the cats playing on the floor. | | A soccer game with multiple males playing. | entailment | Some men are playing a sport. |

Approaches used for NLI include earlier symbolic and statistical approaches to more recent deep learning approaches. Benchmark datasets used for NLI include SNLI, MultiNLI, SciTail, among others. You can get hands-on practice on the SNLI task by following this d2l.ai chapter.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1701–1750 of 1961 papers

Title	Date	Tasks	Status
SemEval-2015 Task 2: Semantic Textual Similarity, English, Spanish and Pilot on Interpretability	Jun 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
SemEval-2015 Task 17: Taxonomy Extraction Evaluation (TExEval)	Jun 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
TATO: Leveraging on Multiple Strategies for Semantic Textual Similarity	Jun 1, 2015	Machine TranslationNatural Language Inference	—Unverified
Fusion of Compositional Network-based and Lexical Function Distributional Semantic Models	Jun 1, 2015	Natural Language InferenceSemantic Composition	—Unverified
ECNU: Using Traditional Similarity Measurements and Word Embedding for Semantic Textual Similarity Estimation	Jun 1, 2015	Multi-Task LearningNatural Language Inference	—Unverified
Resolving Discourse-Deictic Pronouns: A Two-Stage Approach to Do It	Jun 1, 2015	Coreference ResolutionNatural Language Inference	—Unverified
Classification and Acquisition of Contradictory Event Pairs using Crowdsourcing	Jun 1, 2015	ClassificationGeneral Classification	—Unverified
CICBUAPnlp: Graph-Based Approach for Answer Selection in Community Question Answering Task	Jun 1, 2015	Answer SelectionCommunity Question Answering	—Unverified
A Word-Embedding-based Sense Index for Regular Polysemy Representation	Jun 1, 2015	Machine TranslationNatural Language Inference	—Unverified
Multi-Level Alignments As An Extensible Representation Basis for Textual Entailment Algorithms	Jun 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
DLS@CU: Sentence Similarity from Word Alignment and Semantic Vector Composition	Jun 1, 2015	Information RetrievalMachine Translation	—Unverified
JAIST: Combining multiple features for Answer Selection in Community Question Answering	Jun 1, 2015	Answer SelectionCommunity Question Answering	—Unverified
ASAP-II: From the Alignment of Phrases to Textual Similarity	Jun 1, 2015	Natural Language InferenceSemantic Textual Similarity	—Unverified
FBK-HLT: An Effective System for Paraphrase Identification and Semantic Similarity in Twitter	Jun 1, 2015	Information RetrievalMachine Translation	—Unverified
Representing Meaning with a Combination of Logical and Distributional Models	May 26, 2015	Knowledge Base ConstructionLexical Entailment	CodeCode Available
An Optimal Quadratic Approach to Monolingual Paraphrase Alignment	May 1, 2015	Combinatorial OptimizationMachine Translation	—Unverified
Lexical Event Ordering with an Edge-Factored Model	May 1, 2015	modelNatural Language Inference	—Unverified
Exploring Lexical, Syntactic, and Semantic Features for Chinese Textual Entailment in NTCIR RITE Evaluation Tasks	Apr 8, 2015	Binary Classificationnamed-entity-recognition	—Unverified
Efficiency in Ambiguity: Two Models of Probabilistic Semantics for Natural Language	Apr 1, 2015	Coreference ResolutionLearning Semantic Representations	—Unverified
On the Proper Treatment of Quantifiers in Probabilistic Logic Semantics	Apr 1, 2015	Fine-Grained Opinion AnalysisNatural Language Inference	—Unverified
Book Reviews: Recognizing Textual Entailment: Models and Applications by Ido Dagan, Dan Roth, Mark Sammons and Fabio Massimo Zanzotto	Mar 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
Reasoning about Quantities in Natural Language	Jan 1, 2015	MathNatural Language Inference	—Unverified
Encoding Generalized Quantifiers in Dependency-based Compositional Semantics	Dec 1, 2014	Natural Language Inference	—Unverified
Lexical Substitution for the Medical Domain	Oct 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
Exploiting Timegraphs in Temporal Relation Classification	Oct 1, 2014	ClassificationDocument Summarization	—Unverified
Learning Compact Lexicons for CCG Semantic Parsing	Oct 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
Taxonomy Construction Using Syntactic Contextual Evidence	Oct 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
SemEval-2014 Task 1: Evaluation of Compositional Distributional Semantic Models on Full Sentences through Semantic Relatedness and Textual Entailment	Aug 1, 2014	Natural Language InferenceSemantic Textual Similarity	—Unverified
AI-KU: Using Co-Occurrence Modeling for Semantic Similarity	Aug 1, 2014	Information RetrievalLanguage Modelling	—Unverified
Inclusive yet Selective: Supervised Distributional Hypernymy Detection	Aug 1, 2014	Natural Language Inference	—Unverified
UoW: NLP techniques developed at the University of Wolverhampton for Semantic Similarity and Textual Entailment	Aug 1, 2014	Information RetrievalMachine Translation	CodeCode Available
Unsupervised Verb Inference from Nouns Crossing Root Boundary	Aug 1, 2014	Machine TranslationNatural Language Inference	—Unverified
The Meaning Factory: Formal Semantics for Recognizing Textual Entailment and Determining Semantic Similarity	Aug 1, 2014	Natural Language InferenceSemantic Similarity	—Unverified
Argument structure of adverbial derivatives in Russian	Aug 1, 2014	Machine TranslationNatural Language Inference	—Unverified
SemEval-2014 Task 10: Multilingual Semantic Textual Similarity	Aug 1, 2014	Machine TranslationNatural Language Inference	—Unverified
Proposition Knowledge Graphs	Aug 1, 2014	Knowledge GraphsNatural Language Inference	—Unverified
ASAP: Automatic Semantic Alignment for Phrases	Aug 1, 2014	Natural Language Inference	—Unverified
Illinois-LH: A Denotational and Distributional Approach to Semantics	Aug 1, 2014	LemmatizationNatural Language Inference	—Unverified
Text Summarization through Entailment-based Minimum Vertex Cover	Aug 1, 2014	Document SummarizationNatural Language Inference	—Unverified
Compositional Distributional Semantics Models in Chunk-based Smoothed Tree Kernels	Aug 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
Towards Syntax-aware Compositional Distributional Semantic Models	Aug 1, 2014	Document SummarizationMulti-Document Summarization	—Unverified
Focus Annotation in Reading Comprehension Data	Aug 1, 2014	Natural Language InferenceReading Comprehension	—Unverified
Exploring the use of word embeddings and random walks on Wikipedia for the CogAlex shared task	Aug 1, 2014	Information RetrievalNatural Language Inference	—Unverified
Exploring Fine-grained Entity Type Constraints for Distantly Supervised Relation Extraction	Aug 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
An analysis of textual inference in German customer emails	Aug 1, 2014	Natural Language InferenceSemantic Textual Similarity	—Unverified
FBK-TR: SVM for Semantic Relatedeness and Corpus Patterns for RTE	Aug 1, 2014	Natural Language InferenceRTE	—Unverified
haLF: Comparing a Pure CDSM Approach with a Standard Machine Learning System for RTE	Aug 1, 2014	BIG-bench Machine LearningNatural Language Inference	—Unverified
UIO-Lien: Entailment Recognition using Minimal Recursion Semantics	Aug 1, 2014	Dependency ParsingNatural Language Inference	—Unverified
BUAP: Evaluating Compositional Distributional Semantic Models on Full Sentences through Semantic Relatedness and Textual Entailment	Aug 1, 2014	Natural Language InferenceSemantic Textual Similarity	—Unverified
Dead parrots make bad pets: Exploring modifier effects in noun phrases	Aug 1, 2014	Natural Language Inference	—Unverified

Show:10 25 50

← PrevPage 35 of 40Next →

All datasets SNLI RTE MultiNLI QNLI ANLI test WNLI LiDiRus RCB TERRa CommitmentBank SciTail FarsTail

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	% Test Accuracy	94.7	—	Unverified
2	UnitedSynT5 (335M)	% Test Accuracy	93.5	—	Unverified
3	EFL (Entailment as Few-shot Learner) + RoBERTa-large	% Test Accuracy	93.1	—	Unverified
4	Neural Tree Indexers for Text Understanding	% Test Accuracy	93.1	—	Unverified
5	RoBERTa-large+Self-Explaining	% Test Accuracy	92.3	—	Unverified
6	RoBERTa-large + self-explaining layer	% Test Accuracy	92.3	—	Unverified
7	CA-MTL	% Test Accuracy	92.1	—	Unverified
8	SemBERT	% Test Accuracy	91.9	—	Unverified
9	MT-DNN-SMARTLARGEv0	% Test Accuracy	91.7	—	Unverified
10	MT-DNN-SMART_100%ofTrainingData	Dev Accuracy	91.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Vega v2 6B (KD-based prompt transfer)	Accuracy	96	—	Unverified
2	PaLM 540B (fine-tuned)	Accuracy	95.7	—	Unverified
3	Turing NLR v5 XXL 5.4B (fine-tuned)	Accuracy	94.1	—	Unverified
4	ST-MoE-32B 269B (fine-tuned)	Accuracy	93.5	—	Unverified
5	DeBERTa-1.5B	Accuracy	93.2	—	Unverified
6	MUPPET Roberta Large	Accuracy	92.8	—	Unverified
7	DeBERTaV3large	Accuracy	92.7	—	Unverified
8	T5-XXL 11B	Accuracy	92.5	—	Unverified
9	T5-XXL 11B (fine-tuned)	Accuracy	92.5	—	Unverified
10	ST-MoE-L 4.1B (fine-tuned)	Accuracy	92.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	Matched	92.6	—	Unverified
2	Turing NLR v5 XXL 5.4B (fine-tuned)	Matched	92.6	—	Unverified
3	T5-XXL 11B (fine-tuned)	Matched	92	—	Unverified
4	T5	Matched	92	—	Unverified
5	T5-11B	Mismatched	91.7	—	Unverified
6	T5-3B	Matched	91.4	—	Unverified
7	ALBERT	Matched	91.3	—	Unverified
8	DeBERTa (large)	Matched	91.1	—	Unverified
9	Adv-RoBERTa ensemble	Matched	91.1	—	Unverified
10	SMARTRoBERTa	Dev Matched	91.1	—	Unverified