Natural Language Inference

Natural language inference (NLI) is the task of determining whether a "hypothesis" is true (entailment), false (contradiction), or undetermined (neutral) given a "premise".

Example:

| Premise | Label | Hypothesis | | --- | ---| --- | | A man inspects the uniform of a figure in some East Asian country. | contradiction | The man is sleeping. | | An older and younger man smiling. | neutral | Two men are smiling and laughing at the cats playing on the floor. | | A soccer game with multiple males playing. | entailment | Some men are playing a sport. |

Approaches used for NLI include earlier symbolic and statistical approaches to more recent deep learning approaches. Benchmark datasets used for NLI include SNLI, MultiNLI, SciTail, among others. You can get hands-on practice on the SNLI task by following this d2l.ai chapter.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1701–1725 of 1961 papers

Title	Date	Tasks	Status
JAIST: Combining multiple features for Answer Selection in Community Question Answering	Jun 1, 2015	Answer SelectionCommunity Question Answering	—Unverified
SemEval-2015 Task 17: Taxonomy Extraction Evaluation (TExEval)	Jun 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
DLS@CU: Sentence Similarity from Word Alignment and Semantic Vector Composition	Jun 1, 2015	Information RetrievalMachine Translation	—Unverified
TALN-UPF: Taxonomy Learning Exploiting CRF-Based Hypernym Extraction on Encyclopedic Definitions	Jun 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
TATO: Leveraging on Multiple Strategies for Semantic Textual Similarity	Jun 1, 2015	Machine TranslationNatural Language Inference	—Unverified
ASAP-II: From the Alignment of Phrases to Textual Similarity	Jun 1, 2015	Natural Language InferenceSemantic Textual Similarity	—Unverified
CICBUAPnlp: Graph-Based Approach for Answer Selection in Community Question Answering Task	Jun 1, 2015	Answer SelectionCommunity Question Answering	—Unverified
Resolving Discourse-Deictic Pronouns: A Two-Stage Approach to Do It	Jun 1, 2015	Coreference ResolutionNatural Language Inference	—Unverified
Ckylark: A More Robust PCFG-LA Parser	Jun 1, 2015	Machine TranslationNatural Language Inference	CodeCode Available
ECNU: Using Traditional Similarity Measurements and Word Embedding for Semantic Textual Similarity Estimation	Jun 1, 2015	Multi-Task LearningNatural Language Inference	—Unverified
Multi-Level Alignments As An Extensible Representation Basis for Textual Entailment Algorithms	Jun 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
ECNU: Leveraging Word Embeddings to Boost Performance for Paraphrase in Twitter	Jun 1, 2015	Machine TranslationNatural Language Inference	—Unverified
Recognizing Textual Entailment using Dependency Analysis and Machine Learning	Jun 1, 2015	BIG-bench Machine LearningMachine Translation	—Unverified
FBK-HLT: An Effective System for Paraphrase Identification and Semantic Similarity in Twitter	Jun 1, 2015	Information RetrievalMachine Translation	—Unverified
Representing Meaning with a Combination of Logical and Distributional Models	May 26, 2015	Knowledge Base ConstructionLexical Entailment	CodeCode Available
An Optimal Quadratic Approach to Monolingual Paraphrase Alignment	May 1, 2015	Combinatorial OptimizationMachine Translation	—Unverified
Lexical Event Ordering with an Edge-Factored Model	May 1, 2015	modelNatural Language Inference	—Unverified
Exploring Lexical, Syntactic, and Semantic Features for Chinese Textual Entailment in NTCIR RITE Evaluation Tasks	Apr 8, 2015	Binary Classificationnamed-entity-recognition	—Unverified
On the Proper Treatment of Quantifiers in Probabilistic Logic Semantics	Apr 1, 2015	Fine-Grained Opinion AnalysisNatural Language Inference	—Unverified
Efficiency in Ambiguity: Two Models of Probabilistic Semantics for Natural Language	Apr 1, 2015	Coreference ResolutionLearning Semantic Representations	—Unverified
Book Reviews: Recognizing Textual Entailment: Models and Applications by Ido Dagan, Dan Roth, Mark Sammons and Fabio Massimo Zanzotto	Mar 1, 2015	Natural Language InferenceQuestion Answering	—Unverified
Reasoning about Quantities in Natural Language	Jan 1, 2015	MathNatural Language Inference	—Unverified
Encoding Generalized Quantifiers in Dependency-based Compositional Semantics	Dec 1, 2014	Natural Language Inference	—Unverified
Exploiting Timegraphs in Temporal Relation Classification	Oct 1, 2014	ClassificationDocument Summarization	—Unverified
Learning Compact Lexicons for CCG Semantic Parsing	Oct 1, 2014	Natural Language InferenceQuestion Answering	—Unverified

Show:10 25 50

← PrevPage 69 of 79Next →

All datasets SNLI RTE MultiNLI QNLI ANLI test WNLI LiDiRus RCB TERRa CommitmentBank SciTail FarsTail

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	% Test Accuracy	94.7	—	Unverified
2	UnitedSynT5 (335M)	% Test Accuracy	93.5	—	Unverified
3	EFL (Entailment as Few-shot Learner) + RoBERTa-large	% Test Accuracy	93.1	—	Unverified
4	Neural Tree Indexers for Text Understanding	% Test Accuracy	93.1	—	Unverified
5	RoBERTa-large+Self-Explaining	% Test Accuracy	92.3	—	Unverified
6	RoBERTa-large + self-explaining layer	% Test Accuracy	92.3	—	Unverified
7	CA-MTL	% Test Accuracy	92.1	—	Unverified
8	SemBERT	% Test Accuracy	91.9	—	Unverified
9	MT-DNN-SMARTLARGEv0	% Test Accuracy	91.7	—	Unverified
10	MT-DNN-SMART_100%ofTrainingData	Dev Accuracy	91.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Vega v2 6B (KD-based prompt transfer)	Accuracy	96	—	Unverified
2	PaLM 540B (fine-tuned)	Accuracy	95.7	—	Unverified
3	Turing NLR v5 XXL 5.4B (fine-tuned)	Accuracy	94.1	—	Unverified
4	ST-MoE-32B 269B (fine-tuned)	Accuracy	93.5	—	Unverified
5	DeBERTa-1.5B	Accuracy	93.2	—	Unverified
6	MUPPET Roberta Large	Accuracy	92.8	—	Unverified
7	DeBERTaV3large	Accuracy	92.7	—	Unverified
8	T5-XXL 11B	Accuracy	92.5	—	Unverified
9	T5-XXL 11B (fine-tuned)	Accuracy	92.5	—	Unverified
10	ST-MoE-L 4.1B (fine-tuned)	Accuracy	92.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	Matched	92.6	—	Unverified
2	Turing NLR v5 XXL 5.4B (fine-tuned)	Matched	92.6	—	Unverified
3	T5-XXL 11B (fine-tuned)	Matched	92	—	Unverified
4	T5	Matched	92	—	Unverified
5	T5-11B	Mismatched	91.7	—	Unverified
6	T5-3B	Matched	91.4	—	Unverified
7	ALBERT	Matched	91.3	—	Unverified
8	DeBERTa (large)	Matched	91.1	—	Unverified
9	Adv-RoBERTa ensemble	Matched	91.1	—	Unverified
10	SMARTRoBERTa	Dev Matched	91.1	—	Unverified