Natural Language Inference

Natural language inference (NLI) is the task of determining whether a "hypothesis" is true (entailment), false (contradiction), or undetermined (neutral) given a "premise".

Example:

| Premise | Label | Hypothesis | | --- | ---| --- | | A man inspects the uniform of a figure in some East Asian country. | contradiction | The man is sleeping. | | An older and younger man smiling. | neutral | Two men are smiling and laughing at the cats playing on the floor. | | A soccer game with multiple males playing. | entailment | Some men are playing a sport. |

Approaches used for NLI include earlier symbolic and statistical approaches to more recent deep learning approaches. Benchmark datasets used for NLI include SNLI, MultiNLI, SciTail, among others. You can get hands-on practice on the SNLI task by following this d2l.ai chapter.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 1961 papers

Title	Date	Tasks	Status	Hype
Language Fusion for Parameter-Efficient Cross-lingual Transfer	Jan 12, 2025	Cross-Lingual TransferNatural Language Inference	CodeCode Available	0
Assessing Language Comprehension in Large Language Models Using Construction Grammar	Jan 8, 2025	Natural Language InferenceNatural Language Understanding	—Unverified	0
From Superficial Patterns to Semantic Understanding: Fine-Tuning Language Models on Contrast Sets	Jan 5, 2025	Language ModelingLanguage Modelling	—Unverified	0
Tougher Text, Smarter Models: Raising the Bar for Adversarial Defence Benchmarks	Jan 5, 2025	Adversarial RobustnessBenchmarking	CodeCode Available	0
HindiLLM: Large Language Model for Hindi	Dec 29, 2024	Language ModelingLanguage Modelling	—Unverified	0
Defeasible Visual Entailment: Benchmark, Evaluator, and Reward-Driven Optimization	Dec 19, 2024	Contrastive LearningDecision Making	CodeCode Available	1
In-Context Learning Distillation for Efficient Few-Shot Fine-Tuning	Dec 17, 2024	In-Context LearningKnowledge Distillation	—Unverified	0
Multi-head attention debiasing and contrastive learning for mitigating Dataset Artifacts in Natural Language Inference	Dec 16, 2024	Contrastive LearningNatural Language Inference	—Unverified	0
Explainable Procedural Mistake Detection	Dec 16, 2024	Mistake DetectionNatural Language Inference	—Unverified	0
On Adversarial Robustness and Out-of-Distribution Robustness of Large Language Models	Dec 13, 2024	Adversarial RobustnessNatural Language Inference	CodeCode Available	0
First Train to Generate, then Generate to Train: UnitedSynT5 for Few-Shot NLI	Dec 12, 2024	Data AugmentationDiversity	—Unverified	0
Improving the Natural Language Inference robustness to hard dataset by data augmentation and preprocessing	Dec 10, 2024	Data AugmentationNatural Language Inference	—Unverified	0
Consolidating and Developing Benchmarking Datasets for the Nepali Natural Language Understanding Tasks	Nov 28, 2024	BenchmarkingNatural Language Inference	—Unverified	0
Lost in Inference: Rediscovering the Role of Natural Language Inference for Large Language Models	Nov 21, 2024	Natural Language InferenceNatural Language Understanding	—Unverified	0
Transformer-Based Contextualized Language Models Joint with Neural Networks for Natural Language Inference in Vietnamese	Nov 20, 2024	Natural Language InferenceXLM-R	—Unverified	0
PatentEdits: Framing Patent Novelty as Textual Entailment	Nov 20, 2024	Natural Language InferenceSentence	—Unverified	0
Beyond Keywords: A Context-based Hybrid Approach to Mining Ethical Concern-related App Reviews	Nov 11, 2024	EthicsLarge Language Model	—Unverified	0
Gradual Fine-Tuning with Graph Routing for Multi-Source Unsupervised Domain Adaptation	Nov 11, 2024	Domain AdaptationMulti-Source Unsupervised Domain Adaptation	—Unverified	0
Explaining Mixtures of Sources in News Articles	Nov 7, 2024	ArticlesNatural Language Inference	—Unverified	0
Provenance: A Light-weight Fact-checker for Retrieval Augmented LLM Generation Output	Nov 1, 2024	Fact CheckingNatural Language Inference	—Unverified	0
Bonafide at LegalLens 2024 Shared Task: Using Lightweight DeBERTa Based Encoder For Legal Violation Detection and Resolution	Oct 30, 2024	Entity ResolutionNatural Language Inference	CodeCode Available	0
Teaching a Language Model to Distinguish Between Similar Details using a Small Adversarial Training Set	Oct 30, 2024	Language ModelingLanguage Modelling	—Unverified	0
Natural Language Inference Improves Compositionality in Vision-Language Models	Oct 29, 2024	Natural Language Inference	—Unverified	0
Flexible Natural Language-Based Image Data Downlink Prioritization for Nanosatellites	Oct 28, 2024	Natural Language Inference	CodeCode Available	0
Relation-based Counterfactual Data Augmentation and Contrastive Learning for Robustifying Natural Language Inference Models	Oct 28, 2024	Contrastive Learningcounterfactual	—Unverified	0

Show:10 25 50

← PrevPage 3 of 79Next →

All datasets SNLI RTE MultiNLI QNLI ANLI test WNLI LiDiRus RCB TERRa CommitmentBank SciTail FarsTail

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	% Test Accuracy	94.7	—	Unverified
2	UnitedSynT5 (335M)	% Test Accuracy	93.5	—	Unverified
3	EFL (Entailment as Few-shot Learner) + RoBERTa-large	% Test Accuracy	93.1	—	Unverified
4	Neural Tree Indexers for Text Understanding	% Test Accuracy	93.1	—	Unverified
5	RoBERTa-large + self-explaining layer	% Test Accuracy	92.3	—	Unverified
6	RoBERTa-large+Self-Explaining	% Test Accuracy	92.3	—	Unverified
7	CA-MTL	% Test Accuracy	92.1	—	Unverified
8	SemBERT	% Test Accuracy	91.9	—	Unverified
9	MT-DNN-SMARTLARGEv0	% Test Accuracy	91.7	—	Unverified
10	MT-DNN-SMART_100%ofTrainingData	Dev Accuracy	91.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Vega v2 6B (KD-based prompt transfer)	Accuracy	96	—	Unverified
2	PaLM 540B (fine-tuned)	Accuracy	95.7	—	Unverified
3	Turing NLR v5 XXL 5.4B (fine-tuned)	Accuracy	94.1	—	Unverified
4	ST-MoE-32B 269B (fine-tuned)	Accuracy	93.5	—	Unverified
5	DeBERTa-1.5B	Accuracy	93.2	—	Unverified
6	MUPPET Roberta Large	Accuracy	92.8	—	Unverified
7	DeBERTaV3large	Accuracy	92.7	—	Unverified
8	T5-XXL 11B (fine-tuned)	Accuracy	92.5	—	Unverified
9	T5-XXL 11B	Accuracy	92.5	—	Unverified
10	UL2 20B (fine-tuned)	Accuracy	92.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	Matched	92.6	—	Unverified
2	Turing NLR v5 XXL 5.4B (fine-tuned)	Matched	92.6	—	Unverified
3	T5-XXL 11B (fine-tuned)	Matched	92	—	Unverified
4	T5	Matched	92	—	Unverified
5	T5-11B	Mismatched	91.7	—	Unverified
6	T5-3B	Matched	91.4	—	Unverified
7	ALBERT	Matched	91.3	—	Unverified
8	Adv-RoBERTa ensemble	Matched	91.1	—	Unverified
9	DeBERTa (large)	Matched	91.1	—	Unverified
10	SMARTRoBERTa	Dev Matched	91.1	—	Unverified