Natural Language Understanding

Natural Language Understanding is an important field of Natural Language Processing which contains various tasks such as text classification, natural language inference and story comprehension. Applications enabled by natural language understanding range from question answering to automated reasoning.

Source: Find a Reasonable Ending for Stories: Does Logic Relation Help the Story Cloze Test?

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 1978 papers

Title	Date	Tasks	Status	Hype	Score
MathOdyssey: Benchmarking Mathematical Problem-Solving Skills in Large Language Models Using Odyssey Math Data	Jun 26, 2024	BenchmarkingMath	CodeCode Available	2	5
Unified-IO 2: Scaling Autoregressive Multimodal Models with Vision, Language, Audio, and Action	Dec 28, 2023	DecoderImage Generation	CodeCode Available	2	5
MASSIVE: A 1M-Example Multilingual Natural Language Understanding Dataset with 51 Typologically-Diverse Languages	Apr 18, 2022	intent-classificationIntent Classification	CodeCode Available	2	5
MetaMath: Bootstrap Your Own Mathematical Questions for Large Language Models	Sep 21, 2023	Arithmetic ReasoningGSM8K	CodeCode Available	2	5
Reflection-Tuning: Data Recycling Improves LLM Instruction-Tuning	Oct 18, 2023	Natural Language Understanding	CodeCode Available	2	5
SciAssess: Benchmarking LLM Proficiency in Scientific Literature Analysis	Mar 4, 2024	BenchmarkingDrug Discovery	CodeCode Available	2	5
CLUE: A Chinese Language Understanding Evaluation Benchmark	Apr 13, 2020	General ClassificationMachine Reading Comprehension	CodeCode Available	2	5
The First Place Solution of WSDM Cup 2024: Leveraging Large Language Models for Conversational Multi-Doc QA	Feb 28, 2024	Natural Language UnderstandingQuestion Answering	CodeCode Available	2	5
LoRA-Pro: Are Low-Rank Adapters Properly Optimized?	Jul 25, 2024	Code GenerationComputational Efficiency	CodeCode Available	2	5
Learning Transferable Visual Models From Natural Language Supervision	Feb 26, 2021	Action RecognitionBenchmarking	CodeCode Available	2	5
LoRI: Reducing Cross-Task Interference in Multi-Task Low-Rank Adaptation	Apr 10, 2025	Code GenerationContinual Learning	CodeCode Available	2	5
JGLUE: Japanese General Language Understanding Evaluation	Jun 1, 2022	FLUENatural Language Understanding	CodeCode Available	2	5
An Empirical Study of Qwen3 Quantization	May 4, 2025	Natural Language UnderstandingQuantization	CodeCode Available	2	5
BHASA: A Holistic Southeast Asian Linguistic and Cultural Evaluation Suite for Large Language Models	Sep 12, 2023	DiagnosticNatural Language Understanding	CodeCode Available	2	5
BEVDriver: Leveraging BEV Maps in LLMs for Robust Closed-Loop Driving	Mar 5, 2025	Autonomous DrivingMotion Planning	CodeCode Available	2	5
GPT Understands, Too	Mar 18, 2021	Knowledge ProbingLanguage Modeling	CodeCode Available	2	5
Encoder vs Decoder: Comparative Analysis of Encoder and Decoder Language Models on Multilingual NLU Tasks	Jun 19, 2024	DecoderLanguage Modeling	CodeCode Available	2	5
An empirical study of LLaMA3 quantization: from LLMs to MLLMs	Apr 22, 2024	Language ModellingLarge Language Model	CodeCode Available	2	5
DialogStudio: Towards Richest and Most Diverse Unified Dataset Collection for Conversational AI	Jul 19, 2023	Conversational RecommendationDiversity	CodeCode Available	2	5
DeBERTa: Decoding-enhanced BERT with Disentangled Attention	Jun 5, 2020	Common Sense ReasoningCoreference Resolution	CodeCode Available	2	5
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-Disentangled Embedding Sharing	Nov 18, 2021	Language ModelingLanguage Modelling	CodeCode Available	2	5
I-BERT: Integer-only BERT Quantization	Jan 5, 2021	GPUNatural Language Inference	CodeCode Available	2	5
Make LoRA Great Again: Boosting LoRA with Adaptive Singular Values and Mixture-of-Experts Optimization Alignment	Feb 24, 2025	image-classificationImage Classification	CodeCode Available	2	5
It's Not Just Size That Matters: Small Language Models Are Also Few-Shot Learners	Sep 15, 2020	Natural Language Understanding	CodeCode Available	2	5
Large Language Model Safety: A Holistic Survey	Dec 23, 2024	Language ModelingLanguage Modelling	CodeCode Available	2	5
Large Language Models Meet Knowledge Graphs for Question Answering: Synthesis and Opportunities	May 26, 2025	Knowledge GraphsNatural Language Understanding	CodeCode Available	2	5
Adversarial Regularization as Stackelberg Game: An Unrolled Optimization Approach	Apr 11, 2021	Machine TranslationNatural Language Understanding	CodeCode Available	1	5
Visually-Situated Natural Language Understanding with Contrastive Reading Model and Frozen Large Language Models	May 24, 2023	document understandingImage Captioning	CodeCode Available	1	5
Cross-Lingual Semantic Role Labeling with High-Quality Translated Training Corpus	Apr 14, 2020	Natural Language UnderstandingSemantic Role Labeling	CodeCode Available	1	5
Adversarial GLUE: A Multi-Task Benchmark for Robustness Evaluation of Language Models	Nov 4, 2021	Adversarial AttackAdversarial Robustness	CodeCode Available	1	5
AutoTrans: Automating Transformer Design via Reinforced Architecture Search	Sep 4, 2020	Natural Language UnderstandingNavigate	CodeCode Available	1	5
CSKG: The CommonSense Knowledge Graph	Dec 21, 2020	Knowledge GraphsNatural Language Understanding	CodeCode Available	1	5
Automatic Disfluency Detection from Untranscribed Speech	Nov 1, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1	5
Advances of Transformer-Based Models for News Headline Generation	Jul 9, 2020	Headline Generationnamed-entity-recognition	CodeCode Available	1	5
CPT: A Pre-Trained Unbalanced Transformer for Both Chinese Language Understanding and Generation	Sep 13, 2021	DecoderDenoising	CodeCode Available	1	5
Attention Is (not) All You Need for Commonsense Reasoning	May 31, 2019	AllCoreference Resolution	CodeCode Available	1	5
A Win-win Deal: Towards Sparse and Robust Pre-trained Language Models	Oct 11, 2022	Natural Language Understanding	CodeCode Available	1	5
Convolution-enhanced Evolving Attention Networks	Dec 16, 2022	image-classificationImage Classification	CodeCode Available	1	5
CREAK: A Dataset for Commonsense Reasoning over Entity Knowledge	Sep 3, 2021	Fact CheckingFact Verification	CodeCode Available	1	5
C-STS: Conditional Semantic Textual Similarity	May 24, 2023	Information RetrievalLanguage Model Evaluation	CodeCode Available	1	5
A Top-Down Neural Architecture towards Text-Level Parsing of Discourse Rhetorical Structure	May 6, 2020	DecoderDiscourse Parsing	CodeCode Available	1	5
ATCO2 corpus: A Large-Scale Dataset for Research on Automatic Speech Recognition and Natural Language Understanding of Air Traffic Control Communications	Nov 8, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1	5
ConFiguRe: Exploring Discourse-level Chinese Figures of Speech	Sep 16, 2022	Natural Language UnderstandingSentence	CodeCode Available	1	5
Compresso: Structured Pruning with Collaborative Prompting Learns Compact Large Language Models	Oct 8, 2023	MMLUNatural Language Understanding	CodeCode Available	1	5
CONDAQA: A Contrastive Reading Comprehension Dataset for Reasoning about Negation	Nov 1, 2022	Natural Language UnderstandingNegation	CodeCode Available	1	5
Conic10K: A Challenging Math Problem Understanding and Reasoning Dataset	Nov 9, 2023	MathNatural Language Understanding	CodeCode Available	1	5
A Surprisingly Robust Trick for Winograd Schema Challenge	May 15, 2019	Common Sense ReasoningCoreference Resolution	CodeCode Available	1	5
AceGPT, Localizing Large Language Models in Arabic	Sep 21, 2023	Instruction FollowingLanguage Modeling	CodeCode Available	1	5
A Survey of RWKV	Dec 19, 2024	Natural Language UnderstandingSurvey	CodeCode Available	1	5
COMET-ATOMIC 2020: On Symbolic and Neural Commonsense Knowledge Graphs	Oct 12, 2020	Knowledge GraphsNatural Language Understanding	CodeCode Available	1	5

Show:10 25 50

← PrevPage 2 of 40Next →

All datasets PDP60 STREUSLE LexGLUE DialoGLUE fewshot DialoGLUE full GLUE

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	HNN	Accuracy	90	—	Unverified
2	UDSSM-II (ensemble)	Accuracy	78.3	—	Unverified
3	BERT-large 340M	Accuracy	78.3	—	Unverified
4	UDSSM-I (ensemble)	Accuracy	76.7	—	Unverified
5	DSSM	Accuracy	75	—	Unverified
6	UDSSM-II	Accuracy	75	—	Unverified
7	BERT-base 110M + MAS	Accuracy	68.3	—	Unverified
8	USSM + Supervised Deepnet + 3 Knowledge Bases	Accuracy	66.7	—	Unverified
9	Word-level CNN+LSTM (full scoring)	Accuracy	60	—	Unverified
10	Subword-level Transformer LM	Accuracy	58.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BERT (pred POS/lemmas)	Tags (Full) Acc	82.5	—	Unverified
2	BERT (none)	Tags (Full) Acc	82	—	Unverified
3	BERT (gold POS/lemmas)	Tags (Full) Acc	81	—	Unverified
4	GloVe (gold POS/lemmas)	Tags (Full) Acc	79.3	—	Unverified
5	RoBERTa + Linear	Full F1 (Preps)	78.2	—	Unverified
6	GloVe (none)	Tags (Full) Acc	77.5	—	Unverified
7	GloVe (pred POS/lemmas)	Tags (Full) Acc	77.1	—	Unverified
8	SVM (feature-rich, gold syntax)	Role F1 (Preps)	62.2	—	Unverified
9	BiLSTM + MLP (gold syntax)	Role F1 (Preps)	62.2	—	Unverified
10	SVM (feature-rich, auto syntax)	Role F1 (Preps)	58.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CaseLaw-BERT	CaseHOLD	75.6	—	Unverified
2	Legal-BERT	CaseHOLD	75.1	—	Unverified
3	DeBERTa	CaseHOLD	72.1	—	Unverified
4	Longformer	CaseHOLD	72	—	Unverified
5	RoBERTa	CaseHOLD	71.7	—	Unverified
6	BERT	CaseHOLD	70.7	—	Unverified
7	BigBird	CaseHOLD	70.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ConvBERT-DG	Average	74.6	—	Unverified
2	ConvBERT-DG + Pre + Multi	Average	73.8	—	Unverified
3	mslm	Average	73.49	—	Unverified
4	ConvBERT + Pre + Multi	Average	68.22	—	Unverified
5	BanLanGen	Average	39.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ConvBERT + Pre + Multi	Average	86.89	—	Unverified
2	mslm	Average	85.83	—	Unverified
3	ConvBERT-DG + Pre + Multi	Average	85.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Average	89.9	—	Unverified
2	BERT-LARGE	Average	82.1	—	Unverified