Natural Language Inference

Natural language inference (NLI) is the task of determining whether a "hypothesis" is true (entailment), false (contradiction), or undetermined (neutral) given a "premise".

Example:

| Premise | Label | Hypothesis | | --- | ---| --- | | A man inspects the uniform of a figure in some East Asian country. | contradiction | The man is sleeping. | | An older and younger man smiling. | neutral | Two men are smiling and laughing at the cats playing on the floor. | | A soccer game with multiple males playing. | entailment | Some men are playing a sport. |

Approaches used for NLI include earlier symbolic and statistical approaches to more recent deep learning approaches. Benchmark datasets used for NLI include SNLI, MultiNLI, SciTail, among others. You can get hands-on practice on the SNLI task by following this d2l.ai chapter.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1651–1675 of 1961 papers

Title	Date	Tasks	Status
Conformalized Credal Set Predictors	Feb 16, 2024	Conformal PredictionNatural Language Inference	CodeCode Available
ConEntail: An Entailment-based Framework for Universal Zero and Few Shot Classification with Supervised Contrastive Pretraining	Oct 14, 2022	ClassificationNatural Language Inference	CodeCode Available
Enhancing Ethical Explanations of Large Language Models through Iterative Symbolic Refinement	Feb 1, 2024	In-Context LearningNatural Language Inference	CodeCode Available
Enhancing Descriptive Image Captioning with Natural Language Inference	Aug 1, 2021	DescriptiveImage Captioning	CodeCode Available
Accurate and Nuanced Open-QA Evaluation Through Textual Entailment	May 26, 2024	Natural Language InferenceOpen-Domain Question Answering	CodeCode Available
ConCSE: Unified Contrastive Learning and Augmentation for Code-Switched Embeddings	Aug 28, 2024	Contrastive LearningNatural Language Inference	CodeCode Available
Compositional Semantics and Inference System for Temporal Order based on Japanese CCG	Apr 20, 2022	Natural Language Inference	CodeCode Available
Sentence Encoders on STILTs: Supplementary Training on Intermediate Labeled-data Tasks	Nov 2, 2018	Language ModelingLanguage Modelling	CodeCode Available
Enhancing Cross-lingual Natural Language Inference by Soft Prompting with Multilingual Verbalizer	May 22, 2023	Cross-Lingual Natural Language InferenceCross-Lingual Transfer	CodeCode Available
Using Focal Loss to Fight Shallow Heuristics: An Empirical Analysis of Modulated Cross-Entropy in Natural Language Inference	Nov 23, 2022	Natural Language Inference	CodeCode Available
A Logic-Based Framework for Natural Language Inference in Dutch	Oct 7, 2021	Natural Language InferenceSentence	CodeCode Available
Enhancing Cross-lingual Natural Language Inference by Prompt-learning from Cross-lingual Templates	May 1, 2022	Cross-Lingual Natural Language InferenceCross-Lingual Transfer	CodeCode Available
Sentence Pair Scoring: Towards Unified Framework for Text Comprehension	Mar 19, 2016	Natural Language InferenceReading Comprehension	CodeCode Available
Sentence Representations via Gaussian Embedding	May 22, 2023	Contrastive LearningNatural Language Inference	CodeCode Available
Improving Natural Language Inference in Arabic using Transformer Models and Linguistically Informed Pre-Training	Jul 27, 2023	named-entity-recognitionNamed Entity Recognition	CodeCode Available
Overconfidence in the Face of Ambiguity with Adversarial Data	Jul 1, 2022	Natural Language Inference	CodeCode Available
Improving Natural Language Inference with a Pretrained Parser	Sep 18, 2019	Natural Language Inference	CodeCode Available
Improving Personality Consistency in Conversation by Persona Extending	Aug 23, 2022	ChatbotNatural Language Inference	CodeCode Available
Improving Pretrained Models for Zero-shot Multi-label Text Classification through Reinforced Label Hierarchy Reasoning	Apr 4, 2021	BenchmarkingMulti Label Text Classification	CodeCode Available
Improving Results on Russian Sentiment Datasets	Jul 28, 2020	Natural Language InferenceSentiment Analysis	CodeCode Available
Improving Retrieval-Based Question Answering with Deep Inference Models	Dec 7, 2018	Information RetrievalNatural Language Inference	CodeCode Available
Comparing Text Representations: A Theory-Driven Approach	Sep 15, 2021	Language ModelingLanguage Modelling	CodeCode Available
Improving Sentence Embeddings with Automatic Generation of Training Data Using Few-shot Examples	Feb 23, 2024	Dataset GenerationDecoder	CodeCode Available
OYXOY: A Modern NLP Test Suite for Modern Greek	Sep 13, 2023	Natural Language InferenceWord Sense Disambiguation	CodeCode Available
Augmenting Legal Decision Support Systems with LLM-based NLI for Analyzing Social Media Evidence	Oct 21, 2024	Natural Language Inference	CodeCode Available

Show:10 25 50

← PrevPage 67 of 79Next →

All datasets SNLI RTE MultiNLI QNLI ANLI test WNLI LiDiRus RCB TERRa CommitmentBank SciTail FarsTail

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	% Test Accuracy	94.7	—	Unverified
2	UnitedSynT5 (335M)	% Test Accuracy	93.5	—	Unverified
3	EFL (Entailment as Few-shot Learner) + RoBERTa-large	% Test Accuracy	93.1	—	Unverified
4	Neural Tree Indexers for Text Understanding	% Test Accuracy	93.1	—	Unverified
5	RoBERTa-large+Self-Explaining	% Test Accuracy	92.3	—	Unverified
6	RoBERTa-large + self-explaining layer	% Test Accuracy	92.3	—	Unverified
7	CA-MTL	% Test Accuracy	92.1	—	Unverified
8	SemBERT	% Test Accuracy	91.9	—	Unverified
9	MT-DNN-SMARTLARGEv0	% Test Accuracy	91.7	—	Unverified
10	MT-DNN-SMART_100%ofTrainingData	Dev Accuracy	91.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Vega v2 6B (KD-based prompt transfer)	Accuracy	96	—	Unverified
2	PaLM 540B (fine-tuned)	Accuracy	95.7	—	Unverified
3	Turing NLR v5 XXL 5.4B (fine-tuned)	Accuracy	94.1	—	Unverified
4	ST-MoE-32B 269B (fine-tuned)	Accuracy	93.5	—	Unverified
5	DeBERTa-1.5B	Accuracy	93.2	—	Unverified
6	MUPPET Roberta Large	Accuracy	92.8	—	Unverified
7	DeBERTaV3large	Accuracy	92.7	—	Unverified
8	T5-XXL 11B	Accuracy	92.5	—	Unverified
9	T5-XXL 11B (fine-tuned)	Accuracy	92.5	—	Unverified
10	ST-MoE-L 4.1B (fine-tuned)	Accuracy	92.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	Matched	92.6	—	Unverified
2	Turing NLR v5 XXL 5.4B (fine-tuned)	Matched	92.6	—	Unverified
3	T5-XXL 11B (fine-tuned)	Matched	92	—	Unverified
4	T5	Matched	92	—	Unverified
5	T5-11B	Mismatched	91.7	—	Unverified
6	T5-3B	Matched	91.4	—	Unverified
7	ALBERT	Matched	91.3	—	Unverified
8	DeBERTa (large)	Matched	91.1	—	Unverified
9	Adv-RoBERTa ensemble	Matched	91.1	—	Unverified
10	SMARTRoBERTa	Dev Matched	91.1	—	Unverified