Natural Language Inference

Natural language inference (NLI) is the task of determining whether a "hypothesis" is true (entailment), false (contradiction), or undetermined (neutral) given a "premise".

Example:

| Premise | Label | Hypothesis | | --- | ---| --- | | A man inspects the uniform of a figure in some East Asian country. | contradiction | The man is sleeping. | | An older and younger man smiling. | neutral | Two men are smiling and laughing at the cats playing on the floor. | | A soccer game with multiple males playing. | entailment | Some men are playing a sport. |

Approaches used for NLI include earlier symbolic and statistical approaches to more recent deep learning approaches. Benchmark datasets used for NLI include SNLI, MultiNLI, SciTail, among others. You can get hands-on practice on the SNLI task by following this d2l.ai chapter.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1101–1125 of 1961 papers

Title	Date	Tasks	Status
Towards a Generative Approach for Emotion Detection and Reasoning	Aug 9, 2024	Emotion RecognitionGenerative Question Answering	—Unverified
Towards a Gold Standard Corpus for Variable Detection and Linking in Social Science Publications	May 1, 2018	Entity LinkingNatural Language Inference	—Unverified
Towards AMR-BR: A SemBank for Brazilian Portuguese Language	May 1, 2018	Entity LinkingMachine Reading Comprehension	—Unverified
Towards Bootstrapping a Polarity Shifter Lexicon using Linguistic Features	Nov 1, 2017	Natural Language InferenceNegation	—Unverified
Towards Controllable Natural Language Inference through Lexical Inference Types	Aug 7, 2023	Abstract Meaning RepresentationNatural Language Inference	—Unverified
Towards Coreference for Literary Text: Analyzing Domain-Specific Phenomena	Aug 1, 2018	coreference-resolutionCoreference Resolution	—Unverified
Towards Effective Tutorial Feedback for Explanation Questions: A Dataset and Baselines	Jun 1, 2012	Natural Language Inference	—Unverified
Towards Generalizable Sentence Embeddings	Aug 1, 2016	Information RetrievalNatural Language Inference	—Unverified
Towards Improving Abstractive Summarization via Entailment Generation	Sep 1, 2017	Abstractive Text SummarizationDecoder	—Unverified
Towards Linguistically Informed Multi-Objective Pre-Training for Natural Language Inference	Dec 14, 2022	Knowledge GraphsNatural Language Inference	—Unverified
Towards Question Format Independent Numerical Reasoning: A Set of Prerequisite Tasks	May 18, 2020	Natural Language InferenceQuestion Answering	—Unverified
Towards Syntax-aware Compositional Distributional Semantic Models	Aug 1, 2014	Document SummarizationMulti-Document Summarization	—Unverified
Towards the Necessity for Debiasing Natural Language Inference Datasets	May 1, 2020	Natural Language Inference	—Unverified
Towards the Unsupervised Acquisition of Implicit Semantic Roles	Sep 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
Towards Verified Robustness under Text Deletion Interventions	May 1, 2020	Natural Language InferenceSensitivity	—Unverified
Toward the automatic extraction of knowledge of usable goods	Oct 1, 2016	Natural Language InferenceQuestion Answering	—Unverified
To what extent do human explanations of model behavior align with actual model behavior?	Dec 24, 2020	modelNatural Language Inference	—Unverified
To What Extent Do Natural Language Understanding Datasets Correlate to Logical Reasoning? A Method for Diagnosing Logical Reasoning.	Oct 1, 2022	DiagnosticLogical Reasoning	—Unverified
Training a Korean SRL System with Rich Morphological Features	Jun 1, 2014	Natural Language InferenceQuestion Answering	—Unverified
Training Multilingual Machine Translation by Alternately Freezing Language-Specific Encoders-Decoders	May 29, 2020	DecoderMachine Translation	—Unverified
TRANS-BLSTM: Transformer with Bidirectional LSTM for Language Understanding	Mar 16, 2020	Machine TranslationNatural Language Inference	—Unverified
Transducing Sentences to Syntactic Feature Vectors: an Alternative Way to ``Parse''?	Aug 1, 2013	Graph SimilarityNatural Language Inference	—Unverified
Transformer-Based Contextualized Language Models Joint with Neural Networks for Natural Language Inference in Vietnamese	Nov 20, 2024	Natural Language InferenceXLM-R	—Unverified
Transition-based Dependency DAG Parsing Using Dynamic Oracles	Jul 1, 2015	Dependency ParsingFeature Engineering	—Unverified
Trans-KBLSTM: An External Knowledge Enhanced Transformer BiLSTM Model for Tabular Reasoning	May 1, 2022	Common Sense ReasoningNatural Language Inference	—Unverified

Show:10 25 50

← PrevPage 45 of 79Next →

All datasets SNLI RTE MultiNLI QNLI ANLI test WNLI LiDiRus RCB TERRa CommitmentBank SciTail FarsTail

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	% Test Accuracy	94.7	—	Unverified
2	UnitedSynT5 (335M)	% Test Accuracy	93.5	—	Unverified
3	EFL (Entailment as Few-shot Learner) + RoBERTa-large	% Test Accuracy	93.1	—	Unverified
4	Neural Tree Indexers for Text Understanding	% Test Accuracy	93.1	—	Unverified
5	RoBERTa-large+Self-Explaining	% Test Accuracy	92.3	—	Unverified
6	RoBERTa-large + self-explaining layer	% Test Accuracy	92.3	—	Unverified
7	CA-MTL	% Test Accuracy	92.1	—	Unverified
8	SemBERT	% Test Accuracy	91.9	—	Unverified
9	MT-DNN-SMARTLARGEv0	% Test Accuracy	91.7	—	Unverified
10	MT-DNN-SMART_100%ofTrainingData	Dev Accuracy	91.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Vega v2 6B (KD-based prompt transfer)	Accuracy	96	—	Unverified
2	PaLM 540B (fine-tuned)	Accuracy	95.7	—	Unverified
3	Turing NLR v5 XXL 5.4B (fine-tuned)	Accuracy	94.1	—	Unverified
4	ST-MoE-32B 269B (fine-tuned)	Accuracy	93.5	—	Unverified
5	DeBERTa-1.5B	Accuracy	93.2	—	Unverified
6	MUPPET Roberta Large	Accuracy	92.8	—	Unverified
7	DeBERTaV3large	Accuracy	92.7	—	Unverified
8	T5-XXL 11B	Accuracy	92.5	—	Unverified
9	T5-XXL 11B (fine-tuned)	Accuracy	92.5	—	Unverified
10	ST-MoE-L 4.1B (fine-tuned)	Accuracy	92.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	Matched	92.6	—	Unverified
2	Turing NLR v5 XXL 5.4B (fine-tuned)	Matched	92.6	—	Unverified
3	T5-XXL 11B (fine-tuned)	Matched	92	—	Unverified
4	T5	Matched	92	—	Unverified
5	T5-11B	Mismatched	91.7	—	Unverified
6	T5-3B	Matched	91.4	—	Unverified
7	ALBERT	Matched	91.3	—	Unverified
8	DeBERTa (large)	Matched	91.1	—	Unverified
9	Adv-RoBERTa ensemble	Matched	91.1	—	Unverified
10	SMARTRoBERTa	Dev Matched	91.1	—	Unverified