Natural Language Inference

Natural language inference (NLI) is the task of determining whether a "hypothesis" is true (entailment), false (contradiction), or undetermined (neutral) given a "premise".

Example:

| Premise | Label | Hypothesis | | --- | ---| --- | | A man inspects the uniform of a figure in some East Asian country. | contradiction | The man is sleeping. | | An older and younger man smiling. | neutral | Two men are smiling and laughing at the cats playing on the floor. | | A soccer game with multiple males playing. | entailment | Some men are playing a sport. |

Approaches used for NLI include earlier symbolic and statistical approaches to more recent deep learning approaches. Benchmark datasets used for NLI include SNLI, MultiNLI, SciTail, among others. You can get hands-on practice on the SNLI task by following this d2l.ai chapter.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1351–1400 of 1961 papers

Title	Date	Tasks	Status	Hype
Phrase-level Self-Attention Networks for Universal Sentence Encoding	Oct 1, 2018	Multi-class ClassificationNatural Language Inference	—Unverified	0
Cross-Pair Text Representations for Answer Sentence Selection	Oct 1, 2018	Natural Language InferenceOpen-Domain Question Answering	CodeCode Available	0
Hybrid Neural Attention for Agreement/Disagreement Inference in Online Debates	Oct 1, 2018	Natural Language InferenceSentiment Analysis	—Unverified	0
Learning Corresponded Rationales for Text Matching	Sep 27, 2018	Natural Language InferenceQuestion Answering	—Unverified	0
Answering Science Exam Questions Using Query Rewriting with Background Knowledge	Sep 15, 2018	ARCInformation Retrieval	—Unverified	0
Improving Natural Language Inference Using External Knowledge in the Science Questions Domain	Sep 15, 2018	Knowledge GraphsNatural Language Inference	—Unverified	0
XNLI: Evaluating Cross-lingual Sentence Representations	Sep 13, 2018	Cross-Lingual Natural Language InferenceMachine Translation	CodeCode Available	0
AWE: Asymmetric Word Embedding for Textual Entailment	Sep 11, 2018	Natural Language InferenceParaphrase Identification	—Unverified	0
Transforming Question Answering Datasets Into Natural Language Inference Datasets	Sep 9, 2018	Natural Language InferenceQuestion Answering	CodeCode Available	1
Dynamic Compositionality in Recursive Neural Networks with Structure-aware Tag Representations	Sep 7, 2018	Natural Language InferenceSentence	CodeCode Available	0
Cell-aware Stacked LSTMs for Modeling Sentences	Sep 7, 2018	Machine TranslationNatural Language Inference	—Unverified	0
UKP-Athene: Multi-Sentence Textual Entailment for Claim Verification	Sep 3, 2018	Claim VerificationEntity Linking	CodeCode Available	0
DeFactoNLP: Fact Verification using Entity Recognition, TFIDF Vector Comparison and Decomposable Attention	Sep 3, 2018	Fact VerificationNatural Language Inference	CodeCode Available	0
What can we learn from Semantic Tagging?	Aug 29, 2018	Dependency ParsingMulti-Task Learning	—Unverified	0
Bridging Knowledge Gaps in Neural Entailment via Symbolic Models	Aug 28, 2018	Natural Language Inference	—Unverified	0
Sentence Embeddings in NLI with Iterative Refinement Encoders	Aug 27, 2018	Natural Language InferenceSentence	CodeCode Available	0
Adversarially Regularising Neural NLI Models to Integrate Logical Background Knowledge	Aug 26, 2018	BIG-bench Machine LearningLanguage Modeling	CodeCode Available	0
Dynamic Self-Attention : Computing Attention over Words Dynamically for Sentence Embedding	Aug 22, 2018	Natural Language InferenceSentence	CodeCode Available	1
Lessons from Natural Language Inference in the Clinical Domain	Aug 21, 2018	Natural Language InferenceTransfer Learning	CodeCode Available	0
SWAG: A Large-Scale Adversarial Dataset for Grounded Commonsense Inference	Aug 16, 2018	Common Sense ReasoningMultiple-choice	—Unverified	0
REGMAPR - Text Matching Made Easy	Aug 13, 2018	Natural Language InferenceSentence	—Unverified	0
Interpreting Recurrent and Attention-Based Neural Models: a Case Study on Natural Language Inference	Aug 12, 2018	Deep LearningNatural Language Inference	—Unverified	0
TwoWingOS: A Two-Wing Optimization Strategy for Evidential Claim Verification	Aug 10, 2018	Claim VerificationNatural Language Inference	CodeCode Available	0
WARP-Text: a Web-Based Tool for Annotating Relationships between Pairs of Texts	Aug 1, 2018	Machine TranslationNatural Language Inference	CodeCode Available	0
Scoring and Classifying Implicit Positive Interpretations: A Challenge of Class Imbalance	Aug 1, 2018	General ClassificationNatural Language Inference	CodeCode Available	0
Embedding WordNet Knowledge for Textual Entailment	Aug 1, 2018	Feature EngineeringLexical Entailment	—Unverified	0
Adopting the Word-Pair-Dependency-Triplets with Individual Comparison for Natural Language Inference	Aug 1, 2018	Decision MakingMachine Translation	—Unverified	0
Towards Coreference for Literary Text: Analyzing Domain-Specific Phenomena	Aug 1, 2018	coreference-resolutionCoreference Resolution	—Unverified	0
Multiway Attention Networks for Modeling Sentence Pairs	Jul 1, 2018	Natural Language InferenceParaphrase Identification	CodeCode Available	0
Domain Adaptation for Disease Phrase Matching with Adversarial Networks	Jul 1, 2018	Domain AdaptationEntity Linking	—Unverified	0
Unsupervised Source Hierarchies for Low-Resource Neural Machine Translation	Jul 1, 2018	Low Resource Neural Machine TranslationLow-Resource Neural Machine Translation	—Unverified	0
Connecting Supervised and Unsupervised Sentence Embeddings	Jul 1, 2018	DenoisingNatural Language Inference	—Unverified	0
Natural Language Inference with Definition Embedding Considering Context On the Fly	Jul 1, 2018	Domain AdaptationInformation Retrieval	—Unverified	0
BioAMA: Towards an End to End BioMedical Question Answering System	Jul 1, 2018	Natural Language InferenceNER	—Unverified	0
Discovering Implicit Knowledge with Unary Relations	Jul 1, 2018	Deep LearningKnowledge Base Population	CodeCode Available	0
Variational Inference and Deep Generative Models	Jul 1, 2018	Machine TranslationNatural Language Inference	—Unverified	0
Illustrative Language Understanding: Large-Scale Visual Grounding with Image Search	Jul 1, 2018	General ClassificationImage Retrieval	—Unverified	0
Jack the Reader -- A Machine Reading Framework	Jul 1, 2018	ArticlesInformation Retrieval	CodeCode Available	0
Enhancing Sentence Embedding with Generalized Pooling	Jun 26, 2018	Author ProfilingGeneral Classification	CodeCode Available	0
Jack the Reader - A Machine Reading Framework	Jun 20, 2018	ArticlesLink Prediction	CodeCode Available	1
The Natural Language Decathlon: Multitask Learning as Question Answering	Jun 20, 2018	DecoderDomain Adaptation	CodeCode Available	1
GLoMo: Unsupervisedly Learned Relational Graphs as Transferable Representations	Jun 14, 2018	image-classificationImage Classification	CodeCode Available	0
Grounded Textual Entailment	Jun 14, 2018	Natural Language Inference	CodeCode Available	0
Neural Network Models for Paraphrase Identification, Semantic Textual Similarity, Natural Language Inference, and Question Answering	Jun 12, 2018	Natural Language InferenceParaphrase Identification	CodeCode Available	0
Improving Language Understanding by Generative Pre-Training	Jun 11, 2018	Cloze TestDocument Classification	CodeCode Available	1
What Knowledge is Needed to Solve the RTE5 Textual Entailment Challenge?	Jun 10, 2018	Natural Language InferenceRTE	—Unverified	0
Stress Test Evaluation for Natural Language Inference	Jun 2, 2018	Natural Language InferenceNatural Language Understanding	CodeCode Available	0
Predicting Human Metaphor Paraphrase Judgments with Deep Neural Networks	Jun 1, 2018	Binary ClassificationClassification	—Unverified	0
Literal, Metphorical or Both? Detecting Metaphoricity in Isolated Adjective-Noun Phrases	Jun 1, 2018	General ClassificationMachine Translation	—Unverified	0
GKR: the Graphical Knowledge Representation for semantic parsing	Jun 1, 2018	Natural Language InferenceSemantic Parsing	—Unverified	0

Show:10 25 50

← PrevPage 28 of 40Next →

All datasets SNLI RTE MultiNLI QNLI ANLI test WNLI LiDiRus RCB TERRa CommitmentBank SciTail FarsTail

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	% Test Accuracy	94.7	—	Unverified
2	UnitedSynT5 (335M)	% Test Accuracy	93.5	—	Unverified
3	EFL (Entailment as Few-shot Learner) + RoBERTa-large	% Test Accuracy	93.1	—	Unverified
4	Neural Tree Indexers for Text Understanding	% Test Accuracy	93.1	—	Unverified
5	RoBERTa-large+Self-Explaining	% Test Accuracy	92.3	—	Unverified
6	RoBERTa-large + self-explaining layer	% Test Accuracy	92.3	—	Unverified
7	CA-MTL	% Test Accuracy	92.1	—	Unverified
8	SemBERT	% Test Accuracy	91.9	—	Unverified
9	MT-DNN-SMARTLARGEv0	% Test Accuracy	91.7	—	Unverified
10	MT-DNN-SMART_100%ofTrainingData	Dev Accuracy	91.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Vega v2 6B (KD-based prompt transfer)	Accuracy	96	—	Unverified
2	PaLM 540B (fine-tuned)	Accuracy	95.7	—	Unverified
3	Turing NLR v5 XXL 5.4B (fine-tuned)	Accuracy	94.1	—	Unverified
4	ST-MoE-32B 269B (fine-tuned)	Accuracy	93.5	—	Unverified
5	DeBERTa-1.5B	Accuracy	93.2	—	Unverified
6	MUPPET Roberta Large	Accuracy	92.8	—	Unverified
7	DeBERTaV3large	Accuracy	92.7	—	Unverified
8	T5-XXL 11B	Accuracy	92.5	—	Unverified
9	T5-XXL 11B (fine-tuned)	Accuracy	92.5	—	Unverified
10	ST-MoE-L 4.1B (fine-tuned)	Accuracy	92.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	Matched	92.6	—	Unverified
2	Turing NLR v5 XXL 5.4B (fine-tuned)	Matched	92.6	—	Unverified
3	T5-XXL 11B (fine-tuned)	Matched	92	—	Unverified
4	T5	Matched	92	—	Unverified
5	T5-11B	Mismatched	91.7	—	Unverified
6	T5-3B	Matched	91.4	—	Unverified
7	ALBERT	Matched	91.3	—	Unverified
8	DeBERTa (large)	Matched	91.1	—	Unverified
9	Adv-RoBERTa ensemble	Matched	91.1	—	Unverified
10	SMARTRoBERTa	Dev Matched	91.1	—	Unverified