Natural Language Inference

Natural language inference (NLI) is the task of determining whether a "hypothesis" is true (entailment), false (contradiction), or undetermined (neutral) given a "premise".

Example:

| Premise | Label | Hypothesis | | --- | ---| --- | | A man inspects the uniform of a figure in some East Asian country. | contradiction | The man is sleeping. | | An older and younger man smiling. | neutral | Two men are smiling and laughing at the cats playing on the floor. | | A soccer game with multiple males playing. | entailment | Some men are playing a sport. |

Approaches used for NLI include earlier symbolic and statistical approaches to more recent deep learning approaches. Benchmark datasets used for NLI include SNLI, MultiNLI, SciTail, among others. You can get hands-on practice on the SNLI task by following this d2l.ai chapter.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1651–1700 of 1961 papers

Title	Date	Tasks	Status
Conformalized Credal Set Predictors	Feb 16, 2024	Conformal PredictionNatural Language Inference	CodeCode Available
ConEntail: An Entailment-based Framework for Universal Zero and Few Shot Classification with Supervised Contrastive Pretraining	Oct 14, 2022	ClassificationNatural Language Inference	CodeCode Available
Enhancing Ethical Explanations of Large Language Models through Iterative Symbolic Refinement	Feb 1, 2024	In-Context LearningNatural Language Inference	CodeCode Available
Enhancing Descriptive Image Captioning with Natural Language Inference	Aug 1, 2021	DescriptiveImage Captioning	CodeCode Available
Accurate and Nuanced Open-QA Evaluation Through Textual Entailment	May 26, 2024	Natural Language InferenceOpen-Domain Question Answering	CodeCode Available
ConCSE: Unified Contrastive Learning and Augmentation for Code-Switched Embeddings	Aug 28, 2024	Contrastive LearningNatural Language Inference	CodeCode Available
Compositional Semantics and Inference System for Temporal Order based on Japanese CCG	Apr 20, 2022	Natural Language Inference	CodeCode Available
Sentence Encoders on STILTs: Supplementary Training on Intermediate Labeled-data Tasks	Nov 2, 2018	Language ModelingLanguage Modelling	CodeCode Available
Enhancing Cross-lingual Natural Language Inference by Soft Prompting with Multilingual Verbalizer	May 22, 2023	Cross-Lingual Natural Language InferenceCross-Lingual Transfer	CodeCode Available
Using Focal Loss to Fight Shallow Heuristics: An Empirical Analysis of Modulated Cross-Entropy in Natural Language Inference	Nov 23, 2022	Natural Language Inference	CodeCode Available
A Logic-Based Framework for Natural Language Inference in Dutch	Oct 7, 2021	Natural Language InferenceSentence	CodeCode Available
Enhancing Cross-lingual Natural Language Inference by Prompt-learning from Cross-lingual Templates	May 1, 2022	Cross-Lingual Natural Language InferenceCross-Lingual Transfer	CodeCode Available
Sentence Pair Scoring: Towards Unified Framework for Text Comprehension	Mar 19, 2016	Natural Language InferenceReading Comprehension	CodeCode Available
Sentence Representations via Gaussian Embedding	May 22, 2023	Contrastive LearningNatural Language Inference	CodeCode Available
Improving Natural Language Inference in Arabic using Transformer Models and Linguistically Informed Pre-Training	Jul 27, 2023	named-entity-recognitionNamed Entity Recognition	CodeCode Available
Overconfidence in the Face of Ambiguity with Adversarial Data	Jul 1, 2022	Natural Language Inference	CodeCode Available
Improving Natural Language Inference with a Pretrained Parser	Sep 18, 2019	Natural Language Inference	CodeCode Available
Improving Personality Consistency in Conversation by Persona Extending	Aug 23, 2022	ChatbotNatural Language Inference	CodeCode Available
Improving Pretrained Models for Zero-shot Multi-label Text Classification through Reinforced Label Hierarchy Reasoning	Apr 4, 2021	BenchmarkingMulti Label Text Classification	CodeCode Available
Improving Results on Russian Sentiment Datasets	Jul 28, 2020	Natural Language InferenceSentiment Analysis	CodeCode Available
Improving Retrieval-Based Question Answering with Deep Inference Models	Dec 7, 2018	Information RetrievalNatural Language Inference	CodeCode Available
Comparing Text Representations: A Theory-Driven Approach	Sep 15, 2021	Language ModelingLanguage Modelling	CodeCode Available
Improving Sentence Embeddings with Automatic Generation of Training Data Using Few-shot Examples	Feb 23, 2024	Dataset GenerationDecoder	CodeCode Available
OYXOY: A Modern NLP Test Suite for Modern Greek	Sep 13, 2023	Natural Language InferenceWord Sense Disambiguation	CodeCode Available
Augmenting Legal Decision Support Systems with LLM-based NLI for Analyzing Social Media Evidence	Oct 21, 2024	Natural Language Inference	CodeCode Available
Recent Advances in Natural Language Inference: A Survey of Benchmarks, Resources, and Approaches	Apr 2, 2019	Natural Language Inference	CodeCode Available
Improving Truthfulness of Headline Generation	May 2, 2020	Abstractive Text SummarizationDecoder	CodeCode Available
Combining Similarity Features and Deep Representation Learning for Stance Detection in the Context of Checking Fake News	Nov 2, 2018	Document ClassificationGeneral Classification	CodeCode Available
WTMED at MEDIQA 2019: A Hybrid Approach to Biomedical Natural Language Inference	Aug 1, 2019	Natural Language Inference	CodeCode Available
Combining Fact Extraction and Verification with Neural Semantic Matching Networks	Nov 16, 2018	Claim VerificationFact Checking	CodeCode Available
Sequence Learning Using Equilibrium Propagation	Sep 14, 2022	Natural Language InferenceSentiment Analysis	CodeCode Available
Combining Axiom Injection and Knowledge Base Completion for Efficient Natural Language Inference	Nov 15, 2018	Knowledge Base CompletionNatural Language Inference	CodeCode Available
End-Task Oriented Textual Entailment via Deep Explorations of Inter-Sentence Interactions	Apr 24, 2018	Natural Language InferencePosition	CodeCode Available
Embracing Ambiguity: Shifting the Training Target of NLI Models	Jun 6, 2021	Natural Language Inference	CodeCode Available
The Impact of Cross-Lingual Adjustment of Contextual Word Representations on Zero-Shot Transfer	Apr 13, 2022	Continual LearningCross-Lingual Transfer	CodeCode Available
Embarrassingly Simple Performance Prediction for Abductive Natural Language Inference	Feb 21, 2022	Common Sense ReasoningModel Selection	CodeCode Available
Code Comment Inconsistency Detection with BERT and Longformer	Jul 29, 2022	Natural Language Inference	CodeCode Available
Inference and Verbalization Functions During In-Context Learning	Oct 12, 2024	In-Context LearningNatural Language Inference	CodeCode Available
PARADISE: Exploiting Parallel Data for Multilingual Sequence-to-Sequence Pretraining	Aug 4, 2021	Cross-Lingual Natural Language InferenceDenoising	CodeCode Available
InferES : A Natural Language Inference Corpus for Spanish Featuring Negation-Based Contrastive and Adversarial Examples	Oct 6, 2022	Natural Language InferenceNegation	CodeCode Available
Uncertainty-Aware Cross-Lingual Transfer with Pseudo Partial Labels	Jul 1, 2022	Cross-Lingual Transfernamed-entity-recognition	CodeCode Available
Efficient Annotator Reliability Assessment and Sample Weighting for Knowledge-Based Misinformation Detection on Social Media	Oct 18, 2024	ClassificationMisinformation	CodeCode Available
InfoLossQA: Characterizing and Recovering Information Loss in Text Simplification	Jan 29, 2024	Natural Language InferenceText Simplification	CodeCode Available
Effective Cross-Task Transfer Learning for Explainable Natural Language Inference with T5	Oct 31, 2022	Multi-Task LearningNatural Language Inference	CodeCode Available
Several Experiments on Investigating Pretraining and Knowledge-Enhanced Models for Natural Language Inference	Apr 27, 2019	Language ModelingLanguage Modelling	CodeCode Available
Parameter-Efficient Transformer Embeddings	May 4, 2025	Natural Language InferenceSentence	CodeCode Available
Uncertainty-Aware Natural Language Inference with Stochastic Weight Averaging	Apr 10, 2023	Language ModelingNatural Language Inference	CodeCode Available
In Search of the Long-Tail: Systematic Generation of Long-Tail Inferential Knowledge via Logical Rule Guided Search	Nov 13, 2023	Language ModellingNatural Language Inference	CodeCode Available
Uncovering Agendas: A Novel French & English Dataset for Agenda Detection on Social Media	May 1, 2024	Decision MakingNatural Language Inference	CodeCode Available
Using Natural Language Explanations to Improve Robustness of In-context Learning	Nov 13, 2023	In-Context LearningNatural Language Inference	CodeCode Available

Show:10 25 50

← PrevPage 34 of 40Next →

All datasets SNLI RTE MultiNLI QNLI ANLI test WNLI LiDiRus RCB TERRa CommitmentBank SciTail FarsTail

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	% Test Accuracy	94.7	—	Unverified
2	UnitedSynT5 (335M)	% Test Accuracy	93.5	—	Unverified
3	EFL (Entailment as Few-shot Learner) + RoBERTa-large	% Test Accuracy	93.1	—	Unverified
4	Neural Tree Indexers for Text Understanding	% Test Accuracy	93.1	—	Unverified
5	RoBERTa-large + self-explaining layer	% Test Accuracy	92.3	—	Unverified
6	RoBERTa-large+Self-Explaining	% Test Accuracy	92.3	—	Unverified
7	CA-MTL	% Test Accuracy	92.1	—	Unverified
8	SemBERT	% Test Accuracy	91.9	—	Unverified
9	MT-DNN-SMARTLARGEv0	% Test Accuracy	91.7	—	Unverified
10	MT-DNN-SMART_100%ofTrainingData	Dev Accuracy	91.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Vega v2 6B (KD-based prompt transfer)	Accuracy	96	—	Unverified
2	PaLM 540B (fine-tuned)	Accuracy	95.7	—	Unverified
3	Turing NLR v5 XXL 5.4B (fine-tuned)	Accuracy	94.1	—	Unverified
4	ST-MoE-32B 269B (fine-tuned)	Accuracy	93.5	—	Unverified
5	DeBERTa-1.5B	Accuracy	93.2	—	Unverified
6	MUPPET Roberta Large	Accuracy	92.8	—	Unverified
7	DeBERTaV3large	Accuracy	92.7	—	Unverified
8	T5-XXL 11B (fine-tuned)	Accuracy	92.5	—	Unverified
9	T5-XXL 11B	Accuracy	92.5	—	Unverified
10	UL2 20B (fine-tuned)	Accuracy	92.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	Matched	92.6	—	Unverified
2	Turing NLR v5 XXL 5.4B (fine-tuned)	Matched	92.6	—	Unverified
3	T5-XXL 11B (fine-tuned)	Matched	92	—	Unverified
4	T5	Matched	92	—	Unverified
5	T5-11B	Mismatched	91.7	—	Unverified
6	T5-3B	Matched	91.4	—	Unverified
7	ALBERT	Matched	91.3	—	Unverified
8	Adv-RoBERTa ensemble	Matched	91.1	—	Unverified
9	DeBERTa (large)	Matched	91.1	—	Unverified
10	SMARTRoBERTa	Dev Matched	91.1	—	Unverified