Natural Language Inference

Natural language inference (NLI) is the task of determining whether a "hypothesis" is true (entailment), false (contradiction), or undetermined (neutral) given a "premise".

Example:

| Premise | Label | Hypothesis | | --- | ---| --- | | A man inspects the uniform of a figure in some East Asian country. | contradiction | The man is sleeping. | | An older and younger man smiling. | neutral | Two men are smiling and laughing at the cats playing on the floor. | | A soccer game with multiple males playing. | entailment | Some men are playing a sport. |

Approaches used for NLI include earlier symbolic and statistical approaches to more recent deep learning approaches. Benchmark datasets used for NLI include SNLI, MultiNLI, SciTail, among others. You can get hands-on practice on the SNLI task by following this d2l.ai chapter.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1801–1850 of 1961 papers

Title	Date	Tasks	Status
Learning To Avoid Negative Transfer in Few Shot Transfer Learning	Mar 24, 2019	Few-Shot LearningNatural Language Inference	—Unverified
Learning to Compute Word Embeddings On the Fly	Jun 1, 2017	Language ModelingLanguage Modelling	—Unverified
Learning to Generate Examples for Semantic Processing Tasks	Jul 1, 2022	Data AugmentationNatural Language Inference	—Unverified
Learning to Make Inferences in a Semantic Parsing Task	Jan 1, 2016	Machine TranslationNatural Language Inference	—Unverified
Learning to Predict Denotational Probabilities For Modeling Entailment	Apr 1, 2017	Coreference ResolutionNatural Language Inference	—Unverified
Learning to Reason With Adaptive Computation	Oct 24, 2016	BIG-bench Machine LearningNatural Language Inference	—Unverified
Learning to Selectively Transfer: Reinforced Transfer Learning for Deep Text Matching	Dec 30, 2018	Information RetrievalNatural Language Inference	—Unverified
Learning To Use Formulas To Solve Simple Arithmetic Problems	Aug 1, 2016	Natural Language InferenceSemantic Textual Similarity	—Unverified
Learning to Write with Coherence From Negative Examples	Sep 22, 2022	DecoderNatural Language Inference	—Unverified
Learning Verb Inference Rules from Linguistically-Motivated Evidence	Jul 1, 2012	Natural Language InferenceQuestion Answering	—Unverified
Learning What Makes a Difference from Counterfactual Examples and Gradient Supervision	Apr 20, 2020	counterfactualimage-classification	—Unverified
Lessons from the Use of Natural Language Inference (NLI) in Requirements Engineering Tasks	Apr 24, 2024	ChatbotNatural Language Inference	—Unverified
Leveraging Semantic Representations Combined with Contextual Word Representations for Recognizing Textual Entailment in Vietnamese	Jan 1, 2023	Natural Language InferenceNatural Language Understanding	—Unverified
Lexical Event Ordering with an Edge-Factored Model	May 1, 2015	modelNatural Language Inference	—Unverified
Lexical-Morphological Modeling for Legal Text Analysis	Sep 3, 2016	Information RetrievalLanguage Modeling	—Unverified
Lexical Substitution for Evaluating Compositional Distributional Models	Jun 1, 2018	Natural Language InferenceSentence	—Unverified
Lexical Substitution for the Medical Domain	Oct 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
LexSemTm: A Semantic Dataset Based on All-words Unsupervised Sense Distribution Learning	Aug 1, 2016	AllLexical Simplification	—Unverified
Lifting the Curse of Multilinguality by Pre-training Modular Transformers	Nov 16, 2021	named-entity-recognitionNamed Entity Recognition	—Unverified
Lifting the Curse of Multilinguality by Pre-training Modular Transformers	May 12, 2022	named-entity-recognitionNamed Entity Recognition	—Unverified
Light Textual Inference for Semantic Parsing	Dec 1, 2012	Natural Language InferenceSemantic Parsing	—Unverified
LIMSIILES: Basic English Substitution for Student Answer Assessment at SemEval 2013	Jun 1, 2013	Language ModellingMachine Translation	—Unverified
LIPN-CORE: Semantic Text Similarity using n-grams, WordNet, Syntactic Analysis, ESA and Information Retrieval based Features	Jun 1, 2013	Information RetrievalNatural Language Inference	—Unverified
Literal, Metphorical or Both? Detecting Metaphoricity in Isolated Adjective-Noun Phrases	Jun 1, 2018	General ClassificationMachine Translation	—Unverified
Local and Global Context for Supervised and Unsupervised Metonymy Resolution	Jul 1, 2012	Information RetrievalNatural Language Inference	—Unverified
Locality Preserving Loss: Neighbors that Live together, Align together	Apr 7, 2020	Natural Language InferenceSentence Embeddings	—Unverified
Logical Semantics, Dialogical Argumentation, and Textual Entailment	Aug 17, 2020	Natural Language InferenceSentence	—Unverified
Logic-guided Semantic Representation Learning for Zero-Shot Relation Classification	Oct 30, 2020	ClassificationDescriptive	—Unverified
Logic, Language, and Calculus	Jul 6, 2020	Natural Language InferenceNatural Language Understanding	—Unverified
Logic Pre-Training of Language Models	Sep 29, 2021	Logical ReasoningMachine Reading Comprehension	—Unverified
Logic Programs vs. First-Order Formulas in Textual Inference	Mar 1, 2013	Natural Language Inference	—Unverified
Logographic Information Aids Learning Better Representations for Natural Language Inference	Nov 3, 2022	Natural Language InferenceRepresentation Learning	—Unverified
LoNLI: An Extensible Framework for Testing Diverse Logical Reasoning Capabilities for NLI	Dec 4, 2021	Logical ReasoningNatural Language Inference	—Unverified
Looking Beyond Sentence-Level Natural Language Inference for Downstream Tasks	Sep 18, 2020	Natural Language InferenceQuestion Answering	—Unverified
Looking Beyond Sentence-Level Natural Language Inference for Question Answering and Text Summarization	Jun 1, 2021	Multiple-choiceNatural Language Inference	—Unverified
Looking Beyond Short-Premise Natural Language Inference for Downstream Tasks	Dec 4, 2020	Multiple-choiceNatural Language Inference	—Unverified
Looking Beyond the Surface: A Challenge Set for Reading Comprehension over Multiple Sentences	Jun 1, 2018	DiversityNatural Language Inference	—Unverified
Lost in Inference: Rediscovering the Role of Natural Language Inference for Large Language Models	Nov 21, 2024	Natural Language InferenceNatural Language Understanding	—Unverified
LRCTI: A Large Language Model-Based Framework for Multi-Step Evidence Retrieval and Reasoning in Cyber Threat Intelligence Credibility Verification	Jul 15, 2025	Language ModelingLanguage Modelling	—Unverified
Machine and Deep Learning Methods with Manual and Automatic Labelling for News Classification in Bangla Language	Oct 19, 2022	ArticlesClassification	—Unverified
Machine Comprehension using Rich Semantic Representations	Aug 1, 2016	Natural Language InferenceReading Comprehension	—Unverified
Machine Translation Evaluation Resources and Methods: A Survey	May 15, 2016	InformativenessMachine Translation	—Unverified
Make Up Your Mind! Adversarial Generation of Inconsistent Natural Language Explanations	Oct 7, 2019	Decision MakingNatural Language Inference	—Unverified
MALTO at SemEval-2024 Task 6: Leveraging Synthetic Data for LLM Hallucination Detection	Mar 1, 2024	Data AugmentationHallucination	—Unverified
Mandarinograd: A Chinese Collection of Winograd Schemas	May 1, 2020	Common Sense ReasoningNatural Language Inference	—Unverified
MANTIS at TSAR-2022 Shared Task: Improved Unsupervised Lexical Simplification with Pretrained Encoders	Dec 19, 2022	Language ModelingLanguage Modelling	—Unverified
Mapping Texts to Scripts: An Entailment Study	May 1, 2018	Natural Language Inference	—Unverified
Matching Text with Deep Mutual Information Estimation	Mar 9, 2020	Answer SelectionMutual Information Estimation	—Unverified
Match without a Referee: Evaluating MT Adequacy without Reference Translations	Jun 1, 2012	Machine TranslationNatural Language Inference	—Unverified
Max-Cosine Matching Based Neural Models for Recognizing Textual Entailment	May 25, 2017	Natural Language InferenceRTE	—Unverified

Show:10 25 50

← PrevPage 37 of 40Next →

All datasets SNLI RTE MultiNLI QNLI ANLI test WNLI LiDiRus RCB TERRa CommitmentBank SciTail FarsTail

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	% Test Accuracy	94.7	—	Unverified
2	UnitedSynT5 (335M)	% Test Accuracy	93.5	—	Unverified
3	EFL (Entailment as Few-shot Learner) + RoBERTa-large	% Test Accuracy	93.1	—	Unverified
4	Neural Tree Indexers for Text Understanding	% Test Accuracy	93.1	—	Unverified
5	RoBERTa-large+Self-Explaining	% Test Accuracy	92.3	—	Unverified
6	RoBERTa-large + self-explaining layer	% Test Accuracy	92.3	—	Unverified
7	CA-MTL	% Test Accuracy	92.1	—	Unverified
8	SemBERT	% Test Accuracy	91.9	—	Unverified
9	MT-DNN-SMARTLARGEv0	% Test Accuracy	91.7	—	Unverified
10	MT-DNN-SMART_100%ofTrainingData	Dev Accuracy	91.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Vega v2 6B (KD-based prompt transfer)	Accuracy	96	—	Unverified
2	PaLM 540B (fine-tuned)	Accuracy	95.7	—	Unverified
3	Turing NLR v5 XXL 5.4B (fine-tuned)	Accuracy	94.1	—	Unverified
4	ST-MoE-32B 269B (fine-tuned)	Accuracy	93.5	—	Unverified
5	DeBERTa-1.5B	Accuracy	93.2	—	Unverified
6	MUPPET Roberta Large	Accuracy	92.8	—	Unverified
7	DeBERTaV3large	Accuracy	92.7	—	Unverified
8	T5-XXL 11B	Accuracy	92.5	—	Unverified
9	T5-XXL 11B (fine-tuned)	Accuracy	92.5	—	Unverified
10	ST-MoE-L 4.1B (fine-tuned)	Accuracy	92.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	Matched	92.6	—	Unverified
2	Turing NLR v5 XXL 5.4B (fine-tuned)	Matched	92.6	—	Unverified
3	T5-XXL 11B (fine-tuned)	Matched	92	—	Unverified
4	T5	Matched	92	—	Unverified
5	T5-11B	Mismatched	91.7	—	Unverified
6	T5-3B	Matched	91.4	—	Unverified
7	ALBERT	Matched	91.3	—	Unverified
8	DeBERTa (large)	Matched	91.1	—	Unverified
9	Adv-RoBERTa ensemble	Matched	91.1	—	Unverified
10	SMARTRoBERTa	Dev Matched	91.1	—	Unverified