Natural Language Inference

Natural language inference (NLI) is the task of determining whether a "hypothesis" is true (entailment), false (contradiction), or undetermined (neutral) given a "premise".

Example:

| Premise | Label | Hypothesis | | --- | ---| --- | | A man inspects the uniform of a figure in some East Asian country. | contradiction | The man is sleeping. | | An older and younger man smiling. | neutral | Two men are smiling and laughing at the cats playing on the floor. | | A soccer game with multiple males playing. | entailment | Some men are playing a sport. |

Approaches used for NLI include earlier symbolic and statistical approaches to more recent deep learning approaches. Benchmark datasets used for NLI include SNLI, MultiNLI, SciTail, among others. You can get hands-on practice on the SNLI task by following this d2l.ai chapter.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1101–1150 of 1961 papers

Title	Date	Tasks	Status	Hype
HypoNLI: Exploring the Artificial Patterns of Hypothesis-only Bias in Natural Language Inference	Mar 5, 2020	Natural Language Inference	—Unverified	0
PhoBERT: Pre-trained language models for Vietnamese	Mar 2, 2020	Dependency Parsingnamed-entity-recognition	CodeCode Available	1
Quantized Neural Network Inference with Precision Batching	Feb 26, 2020	GPULanguage Modeling	—Unverified	0
Sparse Sinkhorn Attention	Feb 26, 2020	Document ClassificationImage Generation	CodeCode Available	0
Improving BERT Fine-Tuning via Self-Ensemble and Self-Distillation	Feb 24, 2020	Natural Language Inferencetext-classification	CodeCode Available	1
From English To Foreign Languages: Transferring Pre-trained Language Models	Feb 18, 2020	Dependency ParsingGPU	CodeCode Available	1
Stress Test Evaluation of Transformer-based Models in Natural Language Understanding Tasks	Feb 14, 2020	Natural Language InferenceNatural Language Understanding	—Unverified	0
Utilizing BERT Intermediate Layers for Aspect Based Sentiment Analysis and Natural Language Inference	Feb 12, 2020	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available	1
Adversarial Filters of Dataset Biases	Feb 10, 2020	Natural Language Inference	CodeCode Available	1
Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference	Jan 21, 2020	Few-Shot Text ClassificationGeneral Classification	CodeCode Available	1
TextNAS: A Neural Architecture Search Space tailored for Text Representation	Dec 23, 2019	General ClassificationNatural Language Inference	—Unverified	0
Cross-Lingual Ability of Multilingual BERT: An Empirical Study	Dec 17, 2019	named-entity-recognitionNamed Entity Recognition	—Unverified	0
FlauBERT: Unsupervised Language Model Pre-training for French	Dec 11, 2019	FLUELanguage Modeling	CodeCode Available	0
Collecting Entailment Data for Pretraining: New Protocols and Negative Results	Dec 10, 2019	DiversityNatural Language Inference	—Unverified	0
Unsupervised Transfer Learning via BERT Neuron Selection	Dec 10, 2019	Natural Language InferenceSentence	—Unverified	0
Adversarial Analysis of Natural Language Inference Systems	Dec 7, 2019	Multi-Task LearningNatural Language Inference	—Unverified	0
Semi-supervised Visual Feature Integration for Pre-trained Language Models	Dec 1, 2019	Natural Language InferenceNatural Language Understanding	—Unverified	0
Compositional De-Attention Networks	Dec 1, 2019	Machine TranslationNatural Language Inference	—Unverified	0
Paraphrasing Verbs for Noun Compound Interpretation	Nov 20, 2019	Natural Language InferenceSentence	—Unverified	0
Distributionally Robust Neural Networks for Group Shifts: On the Importance of Regularization for Worst-Case Generalization	Nov 20, 2019	Domain GeneralizationNatural Language Inference	CodeCode Available	1
Generating Persona Consistent Dialogues by Exploiting Natural Language Inference	Nov 14, 2019	DecoderDialogue Generation	CodeCode Available	0
Learning to Few-Shot Learn Across Diverse Natural Language Classification Tasks	Nov 10, 2019	DiversityEntity Typing	CodeCode Available	0
CamemBERT: a Tasty French Language Model	Nov 10, 2019	Dependency ParsingLanguage Modeling	CodeCode Available	0
Increasing Robustness to Spurious Correlations using Forgettable Examples	Nov 10, 2019	Natural Language InferenceNatural Language Understanding	—Unverified	0
Multi-Perspective Inferrer: Reasoning Sentences Relationship from Holistic Perspective	Nov 9, 2019	Natural Language InferenceSentence	—Unverified	0
What Would Elsa Do? Freezing Layers During Transformer Fine-Tuning	Nov 8, 2019	Linguistic AcceptabilityNatural Language Inference	—Unverified	0
SMART: Robust and Efficient Fine-Tuning for Pre-trained Natural Language Models through Principled Regularized Optimization	Nov 8, 2019	Linguistic AcceptabilityNatural Language Inference	CodeCode Available	1
Probing Contextualized Sentence Representations with Visual Awareness	Nov 7, 2019	DiversityMachine Translation	—Unverified	0
Transformation of Dense and Sparse Text Representations	Nov 7, 2019	General ClassificationNatural Language Inference	CodeCode Available	0
BERTs of a feather do not generalize together: Large variability in generalization across models with similar test set performance	Nov 7, 2019	Natural Language Inference	CodeCode Available	1
Infusing Knowledge into the Textual Entailment Task Using Graph Convolutional Networks	Nov 5, 2019	Knowledge GraphsNatural Language Inference	—Unverified	0
Path-Based Contextualization of Knowledge Graphs for Textual Entailment	Nov 5, 2019	Knowledge GraphsNatural Language Inference	—Unverified	0
Posing Fair Generalization Tasks for Natural Language Inference	Nov 3, 2019	FairnessNatural Language Inference	—Unverified	0
ZEN: Pre-training Chinese Text Encoder Enhanced by N-gram Representations	Nov 2, 2019	Chinese Named Entity RecognitionChinese Word Segmentation	CodeCode Available	1
Asynchronous Deep Interaction Network for Natural Language Inference	Nov 1, 2019	Natural Language InferenceSentence	—Unverified	0
IFlyLegal: A Chinese Legal System for Consultation, Law Searching, and Document Analysis	Nov 1, 2019	Natural Language InferenceQuestion Answering	—Unverified	0
How well do NLI models capture verb veridicality?	Nov 1, 2019	Natural Language InferenceNegation	—Unverified	0
Original Semantics-Oriented Attention and Deep Fusion Network for Sentence Matching	Nov 1, 2019	Natural Language InferenceParaphrase Identification	—Unverified	0
Fine-tune BERT with Sparse Self-Attention Mechanism	Nov 1, 2019	Natural Language InferenceQuestion Answering	—Unverified	0
Evaluating BERT for natural language inference: A case study on the CommitmentBank	Nov 1, 2019	Natural Language InferenceNegation	—Unverified	0
Aggregating Bidirectional Encoder Representations Using MatchLSTM for Sequence Matching	Nov 1, 2019	Natural Language InferencePosition	—Unverified	0
Incorporating Contextual and Syntactic Structures Improves Semantic Similarity Modeling	Nov 1, 2019	Natural Language InferenceQuestion Answering	—Unverified	0
A Comparative Analysis of Unsupervised Language Adaptation Methods	Nov 1, 2019	Natural Language InferenceSentence	—Unverified	0
Extractive NarrativeQA with Heuristic Pre-Training	Nov 1, 2019	Natural Language InferencePassage Retrieval	—Unverified	0
BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension	Oct 29, 2019	Abstractive Text SummarizationDecoder	CodeCode Available	1
Evaluating the Factual Consistency of Abstractive Text Summarization	Oct 28, 2019	Abstractive Text SummarizationFact Checking	CodeCode Available	1
Thieves on Sesame Street! Model Extraction of BERT-based APIs	Oct 27, 2019	Language ModelingLanguage Modelling	CodeCode Available	0
Word-level Textual Adversarial Attacking as Combinatorial Optimization	Oct 27, 2019	Adversarial AttackCombinatorial Optimization	CodeCode Available	0
A memory enhanced LSTM for modeling complex temporal dependencies	Oct 25, 2019	Natural Language Inference	—Unverified	0
Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer	Oct 23, 2019	Answer GenerationCommon Sense Reasoning	CodeCode Available	2

Show:10 25 50

← PrevPage 23 of 40Next →

All datasets SNLI RTE MultiNLI QNLI ANLI test WNLI LiDiRus RCB TERRa CommitmentBank SciTail FarsTail

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	% Test Accuracy	94.7	—	Unverified
2	UnitedSynT5 (335M)	% Test Accuracy	93.5	—	Unverified
3	EFL (Entailment as Few-shot Learner) + RoBERTa-large	% Test Accuracy	93.1	—	Unverified
4	Neural Tree Indexers for Text Understanding	% Test Accuracy	93.1	—	Unverified
5	RoBERTa-large+Self-Explaining	% Test Accuracy	92.3	—	Unverified
6	RoBERTa-large + self-explaining layer	% Test Accuracy	92.3	—	Unverified
7	CA-MTL	% Test Accuracy	92.1	—	Unverified
8	SemBERT	% Test Accuracy	91.9	—	Unverified
9	MT-DNN-SMARTLARGEv0	% Test Accuracy	91.7	—	Unverified
10	MT-DNN-SMART_100%ofTrainingData	Dev Accuracy	91.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Vega v2 6B (KD-based prompt transfer)	Accuracy	96	—	Unverified
2	PaLM 540B (fine-tuned)	Accuracy	95.7	—	Unverified
3	Turing NLR v5 XXL 5.4B (fine-tuned)	Accuracy	94.1	—	Unverified
4	ST-MoE-32B 269B (fine-tuned)	Accuracy	93.5	—	Unverified
5	DeBERTa-1.5B	Accuracy	93.2	—	Unverified
6	MUPPET Roberta Large	Accuracy	92.8	—	Unverified
7	DeBERTaV3large	Accuracy	92.7	—	Unverified
8	T5-XXL 11B	Accuracy	92.5	—	Unverified
9	T5-XXL 11B (fine-tuned)	Accuracy	92.5	—	Unverified
10	ST-MoE-L 4.1B (fine-tuned)	Accuracy	92.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	Matched	92.6	—	Unverified
2	Turing NLR v5 XXL 5.4B (fine-tuned)	Matched	92.6	—	Unverified
3	T5-XXL 11B (fine-tuned)	Matched	92	—	Unverified
4	T5	Matched	92	—	Unverified
5	T5-11B	Mismatched	91.7	—	Unverified
6	T5-3B	Matched	91.4	—	Unverified
7	ALBERT	Matched	91.3	—	Unverified
8	DeBERTa (large)	Matched	91.1	—	Unverified
9	Adv-RoBERTa ensemble	Matched	91.1	—	Unverified
10	SMARTRoBERTa	Dev Matched	91.1	—	Unverified