Natural Language Inference

Natural language inference (NLI) is the task of determining whether a "hypothesis" is true (entailment), false (contradiction), or undetermined (neutral) given a "premise".

Example:

| Premise | Label | Hypothesis | | --- | ---| --- | | A man inspects the uniform of a figure in some East Asian country. | contradiction | The man is sleeping. | | An older and younger man smiling. | neutral | Two men are smiling and laughing at the cats playing on the floor. | | A soccer game with multiple males playing. | entailment | Some men are playing a sport. |

Approaches used for NLI include earlier symbolic and statistical approaches to more recent deep learning approaches. Benchmark datasets used for NLI include SNLI, MultiNLI, SciTail, among others. You can get hands-on practice on the SNLI task by following this d2l.ai chapter.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1901–1950 of 1961 papers

Title	Date	Tasks	Status
Marked Attribute Bias in Natural Language Inference	Sep 28, 2021	AttributeNatural Language Inference	CodeCode Available
Marking: Visual Grading with Highlighting Errors and Annotating Missing Bits	Apr 22, 2024	Natural Language Inference	CodeCode Available
DiSAN: Directional Self-Attention Network for RNN/CNN-Free Language Understanding	Sep 14, 2017	Natural Language InferenceSentence	CodeCode Available
Disambiguation of Verbal Shifters	May 1, 2018	Natural Language InferenceNegation	CodeCode Available
DIBERT: Dependency Injected Bidirectional Encoder Representations from Transformers	Dec 5, 2021	Language ModelingLanguage Modelling	CodeCode Available
An Understanding-Oriented Robust Machine Reading Comprehension Model	Jul 1, 2022	Machine Reading Comprehensionmodel	CodeCode Available
Switching Contexts: Transportability Measures for NLP	May 3, 2021	named-entity-recognitionNamed Entity Recognition	CodeCode Available
Reinforced Self-Attention Network: a Hybrid of Hard and Soft Attention for Sequence Modeling	Jan 31, 2018	Hard AttentionNatural Language Inference	CodeCode Available
Adversarial Self-Attention for Language Understanding	Jun 25, 2022	Machine Reading ComprehensionNamed Entity Recognition (NER)	CodeCode Available
Unsupervised Improvement of Factual Knowledge in Language Models	Apr 4, 2023	Language ModelingLanguage Modelling	CodeCode Available
XLM-V: Overcoming the Vocabulary Bottleneck in Multilingual Masked Language Models	Jan 25, 2023	Language ModelingLanguage Modelling	CodeCode Available
Developmental Negation Processing in Transformer Language Models	Apr 29, 2022	DiagnosticNatural Language Inference	CodeCode Available
Reordering Examples Helps during Priming-based Few-Shot Learning	Jun 3, 2021	Few-Shot LearningNatural Language Inference	CodeCode Available
Representing Meaning with a Combination of Logical and Distributional Models	May 26, 2015	Knowledge Base ConstructionLexical Entailment	CodeCode Available
Symmetric Regularization based BERT for Pair-wise Semantic Reasoning	Sep 8, 2019	Machine Reading ComprehensionNatural Language Inference	CodeCode Available
Unsupervised Learning of Explainable Parse Trees for Improved Generalisation	Apr 11, 2021	Natural Language InferenceSentence	CodeCode Available
A Novel Cartography-Based Curriculum Learning Method Applied on RoNLI: The First Romanian Natural Language Inference Corpus	May 20, 2024	Machine TranslationNatural Language Inference	CodeCode Available
A Comparative Study of Pre-training and Self-training	Sep 4, 2024	Data AugmentationNatural Language Inference	CodeCode Available
Leveraging Codebook Knowledge with NLI and ChatGPT for Zero-Shot Political Relation Classification	Aug 15, 2023	ClassificationNatural Language Inference	CodeCode Available
MedNLI Is Not Immune: Natural Language Inference Artifacts in the Clinical Domain	Jun 2, 2021	Natural Language InferenceNegation	CodeCode Available
Synthetic Dataset for Evaluating Complex Compositional Knowledge for Natural Language Inference	Jul 11, 2023	Natural Language InferenceNegation	CodeCode Available
Training Complex Models with Multi-Task Weak Supervision	Oct 5, 2018	Matrix CompletionNatural Language Inference	CodeCode Available
Detecting Statements in Text: A Domain-Agnostic Few-Shot Solution	May 9, 2024	Few-Shot LearningNatural Language Inference	CodeCode Available
Rethinking the Event Coding Pipeline with Prompt Entailment	Oct 11, 2022	HumanitarianLanguage Modelling	CodeCode Available
Detecting Entailment in Code-Mixed Hindi-English Conversations	Nov 1, 2020	Data AugmentationLanguage Modeling	CodeCode Available
TabPert: An Effective Platform for Tabular Perturbation	Aug 2, 2021	counterfactualNatural Language Inference	CodeCode Available
TabPert : An Effective Platform for Tabular Perturbation	Nov 1, 2021	counterfactualNatural Language Inference	CodeCode Available
Revisiting neural relation classification in clinical notes with external information	Oct 1, 2018	ClassificationFeature Engineering	CodeCode Available
DELTA: A DEep learning based Language Technology plAtform	Aug 2, 2019	Abstractive Text SummarizationDeep Learning	CodeCode Available
DeFactoNLP: Fact Verification using Entity Recognition, TFIDF Vector Comparison and Decomposable Attention	Sep 3, 2018	Fact VerificationNatural Language Inference	CodeCode Available
MINIMAL: Mining Models for Data Free Universal Adversarial Triggers	Sep 25, 2021	Natural Language Inference	CodeCode Available
Deep Neural Representations for Multiword Expressions Detection	May 1, 2022	Language ModellingNatural Language Inference	CodeCode Available
Unsupervised Natural Language Inference Using PHL Triplet Generation	Oct 16, 2021	Natural Language InferenceSentence	CodeCode Available
Bipol: Multi-axes Evaluation of Bias with Explainability in Benchmark Datasets	Jan 28, 2023	Bias DetectionDiagnostic	CodeCode Available
BioNLI: Generating a Biomedical NLI Dataset Using Lexico-semantic Constraints for Adversarial Examples	Oct 26, 2022	Decision MakingNatural Language Inference	CodeCode Available
Robust Cross-lingual Hypernymy Detection using Dependency Context	Mar 30, 2018	Natural Language InferenceWord Embeddings	CodeCode Available
Robust Document Retrieval and Individual Evidence Modeling for Fact Extraction and Verification.	Nov 1, 2018	Natural Language InferenceRetrieval	CodeCode Available
MobileBERT: a Compact Task-Agnostic BERT for Resource-Limited Devices	Apr 6, 2020	Natural Language InferenceQuestion Answering	CodeCode Available
Deep Natural Language Feature Learning for Interpretable Prediction	Nov 9, 2023	In-Context LearningLanguage Modeling	CodeCode Available
Unsupervised Natural Language Inference via Decoupled Multimodal Contrastive Learning	Oct 16, 2020	Contrastive LearningNatural Language Inference	CodeCode Available
Deep Learning for Entity Matching: A Design Space Exploration	May 1, 2018	Deep LearningEntity Linking	CodeCode Available
Deep Generative Model for Joint Alignment and Word Representation	Feb 16, 2018	Natural Language Inferencetext similarity	CodeCode Available
Take It Easy: Label-Adaptive Self-Rationalization for Fact Verification and Explanation Generation	Oct 5, 2024	Explanation GenerationFact Checking	CodeCode Available
When data permutations are pathological: the case of neural natural language inference	Oct 1, 2018	Natural Language Inference	CodeCode Available
A Multiple Choices Reading Comprehension Corpus for Vietnamese Language Education	Mar 31, 2023	ArticlesMachine Reading Comprehension	CodeCode Available
Modelling Instance-Level Annotator Reliability for Natural Language Labelling Tasks	May 13, 2019	Natural Language Inferencetext-classification	CodeCode Available
Declarative Question Answering over Knowledge Bases containing Natural Language Text with Answer Set Programming	May 1, 2019	Logical ReasoningNatural Language Inference	CodeCode Available
Role of Language Relatedness in Multilingual Fine-tuning of Language Models: A Case Study in Indo-Aryan Languages	Sep 22, 2021	Multiple Choice Question Answering (MCQA)Natural Language Inference	CodeCode Available
RPN: A Word Vector Level Data Augmentation Algorithm in Deep Learning for Language Understanding	Dec 12, 2022	CoLAData Augmentation	CodeCode Available
Neural Natural Language Inference Models Partially Embed Theories of Lexical Entailment and Negation	Apr 30, 2020	Lexical EntailmentNatural Language Inference	CodeCode Available

Show:10 25 50

← PrevPage 39 of 40Next →

All datasets SNLI RTE MultiNLI QNLI ANLI test WNLI LiDiRus RCB TERRa CommitmentBank SciTail FarsTail

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	% Test Accuracy	94.7	—	Unverified
2	UnitedSynT5 (335M)	% Test Accuracy	93.5	—	Unverified
3	EFL (Entailment as Few-shot Learner) + RoBERTa-large	% Test Accuracy	93.1	—	Unverified
4	Neural Tree Indexers for Text Understanding	% Test Accuracy	93.1	—	Unverified
5	RoBERTa-large+Self-Explaining	% Test Accuracy	92.3	—	Unverified
6	RoBERTa-large + self-explaining layer	% Test Accuracy	92.3	—	Unverified
7	CA-MTL	% Test Accuracy	92.1	—	Unverified
8	SemBERT	% Test Accuracy	91.9	—	Unverified
9	MT-DNN-SMARTLARGEv0	% Test Accuracy	91.7	—	Unverified
10	MT-DNN-SMART_100%ofTrainingData	Dev Accuracy	91.6	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Vega v2 6B (KD-based prompt transfer)	Accuracy	96	—	Unverified
2	PaLM 540B (fine-tuned)	Accuracy	95.7	—	Unverified
3	Turing NLR v5 XXL 5.4B (fine-tuned)	Accuracy	94.1	—	Unverified
4	ST-MoE-32B 269B (fine-tuned)	Accuracy	93.5	—	Unverified
5	DeBERTa-1.5B	Accuracy	93.2	—	Unverified
6	MUPPET Roberta Large	Accuracy	92.8	—	Unverified
7	DeBERTaV3large	Accuracy	92.7	—	Unverified
8	T5-XXL 11B	Accuracy	92.5	—	Unverified
9	T5-XXL 11B (fine-tuned)	Accuracy	92.5	—	Unverified
10	ST-MoE-L 4.1B (fine-tuned)	Accuracy	92.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	UnitedSynT5 (3B)	Matched	92.6	—	Unverified
2	Turing NLR v5 XXL 5.4B (fine-tuned)	Matched	92.6	—	Unverified
3	T5-XXL 11B (fine-tuned)	Matched	92	—	Unverified
4	T5	Matched	92	—	Unverified
5	T5-11B	Mismatched	91.7	—	Unverified
6	T5-3B	Matched	91.4	—	Unverified
7	ALBERT	Matched	91.3	—	Unverified
8	DeBERTa (large)	Matched	91.1	—	Unverified
9	Adv-RoBERTa ensemble	Matched	91.1	—	Unverified
10	SMARTRoBERTa	Dev Matched	91.1	—	Unverified