Natural Language Understanding

Natural Language Understanding is an important field of Natural Language Processing which contains various tasks such as text classification, natural language inference and story comprehension. Applications enabled by natural language understanding range from question answering to automated reasoning.

Source: Find a Reasonable Ending for Stories: Does Logic Relation Help the Story Cloze Test?

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 426–450 of 1978 papers

Title	Date	Tasks	Status
TUMS: Enhancing Tool-use Abilities of LLMs with Multi-structure Handlers	May 13, 2025	Natural Language UnderstandingTask 2	—Unverified
A Social Robot with Inner Speech for Dietary Guidance	May 13, 2025	Computational EfficiencyDecision Making	CodeCode Available
Vision-Language-Action Models: Concepts, Progress, Applications and Challenges	May 7, 2025	Autonomous VehiclesNatural Language Understanding	—Unverified
A Comparative Analysis of Ethical and Safety Gaps in LLMs using Relative Danger Coefficient	May 6, 2025	Natural Language Understanding	—Unverified
Structured Prompting and Feedback-Guided Reasoning with LLMs for Data Interpretation	May 3, 2025	Natural Language Understanding	—Unverified
TRAVELER: A Benchmark for Evaluating Temporal Reasoning across Vague, Implicit and Explicit References	May 2, 2025	Natural Language UnderstandingQuestion Answering	—Unverified
Understanding LLM Scientific Reasoning through Promptings and Model's Explanation on the Answers	May 2, 2025	Natural Language UnderstandingPrompt Engineering	—Unverified
Hallucinations and Key Information Extraction in Medical Texts: A Comprehensive Assessment of Open-Source Large Language Models	Apr 27, 2025	Key Information ExtractionNatural Language Understanding	—Unverified
Auto-SLURP: A Benchmark Dataset for Evaluating Multi-Agent Frameworks in Smart Personal Assistant	Apr 25, 2025	Natural Language UnderstandingResponse Generation	CodeCode Available
Pushing the boundary on Natural Language Inference	Apr 25, 2025	Fact CheckingInformation Retrieval	—Unverified
A Survey of Foundation Model-Powered Recommender Systems: From Feature-Based, Generative to Agentic Paradigms	Apr 23, 2025	Natural Language UnderstandingRecommendation Systems	—Unverified
TD-Suite: All Batteries Included Framework for Technical Debt Classification	Apr 15, 2025	AllBinary Classification	CodeCode Available
Kongzi: A Historical Large Language Model with Fact Enhancement	Apr 13, 2025	Language ModelingLanguage Modelling	—Unverified
Can you map it to English? The Role of Cross-Lingual Alignment in Multilingual Performance of LLMs	Apr 13, 2025	BelebeleMachine Translation	CodeCode Available
Knowledge Graph-extended Retrieval Augmented Generation for Question Answering	Apr 11, 2025	In-Context LearningInformation Retrieval	—Unverified
PathGPT: Leveraging Large Language Models for Personalized Route Generation	Apr 8, 2025	Natural Language UnderstandingRAG	—Unverified
Assessing how hyperparameters impact Large Language Models' sarcasm detection performance	Apr 8, 2025	Natural Language UnderstandingSarcasm Detection	—Unverified
AROMA: Autonomous Rank-one Matrix Adaptation	Apr 6, 2025	Natural Language Understandingparameter-efficient fine-tuning	CodeCode Available
Catastrophic Forgetting in LLMs: A Comparative Analysis Across Language Tasks	Apr 1, 2025	CoLAContinual Learning	—Unverified
Reasoning-SQL: Reinforcement Learning with SQL Tailored Partial Rewards for Reasoning-Enhanced Text-to-SQL	Mar 29, 2025	Natural Language UnderstandingReinforcement Learning (RL)	—Unverified
VectorFit : Adaptive Singular & Bias Vector Fine-Tuning of Pre-trained Foundation Models	Mar 25, 2025	image-classificationImage Classification	—Unverified
Language-specific Neurons Do Not Facilitate Cross-Lingual Transfer	Mar 21, 2025	Cross-Lingual TransferNatural Language Understanding	—Unverified
Natural Language Generation	Mar 20, 2025	Image CaptioningImage to text	—Unverified
OmniGeo: Towards a Multimodal Large Language Models for Geospatial Artificial Intelligence	Mar 20, 2025	Instruction FollowingNatural Language Understanding	—Unverified
A Review on Large Language Models for Visual Analytics	Mar 19, 2025	Natural Language UnderstandingText Generation	—Unverified

Show:10 25 50

← PrevPage 18 of 80Next →

All datasets PDP60 STREUSLE LexGLUE DialoGLUE fewshot DialoGLUE full GLUE

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	HNN	Accuracy	90	—	Unverified
2	UDSSM-II (ensemble)	Accuracy	78.3	—	Unverified
3	BERT-large 340M	Accuracy	78.3	—	Unverified
4	UDSSM-I (ensemble)	Accuracy	76.7	—	Unverified
5	DSSM	Accuracy	75	—	Unverified
6	UDSSM-II	Accuracy	75	—	Unverified
7	BERT-base 110M + MAS	Accuracy	68.3	—	Unverified
8	USSM + Supervised Deepnet + 3 Knowledge Bases	Accuracy	66.7	—	Unverified
9	Word-level CNN+LSTM (full scoring)	Accuracy	60	—	Unverified
10	Subword-level Transformer LM	Accuracy	58.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BERT (pred POS/lemmas)	Tags (Full) Acc	82.5	—	Unverified
2	BERT (none)	Tags (Full) Acc	82	—	Unverified
3	BERT (gold POS/lemmas)	Tags (Full) Acc	81	—	Unverified
4	GloVe (gold POS/lemmas)	Tags (Full) Acc	79.3	—	Unverified
5	RoBERTa + Linear	Full F1 (Preps)	78.2	—	Unverified
6	GloVe (none)	Tags (Full) Acc	77.5	—	Unverified
7	GloVe (pred POS/lemmas)	Tags (Full) Acc	77.1	—	Unverified
8	SVM (feature-rich, gold syntax)	Role F1 (Preps)	62.2	—	Unverified
9	BiLSTM + MLP (gold syntax)	Role F1 (Preps)	62.2	—	Unverified
10	SVM (feature-rich, auto syntax)	Role F1 (Preps)	58.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CaseLaw-BERT	CaseHOLD	75.6	—	Unverified
2	Legal-BERT	CaseHOLD	75.1	—	Unverified
3	DeBERTa	CaseHOLD	72.1	—	Unverified
4	Longformer	CaseHOLD	72	—	Unverified
5	RoBERTa	CaseHOLD	71.7	—	Unverified
6	BERT	CaseHOLD	70.7	—	Unverified
7	BigBird	CaseHOLD	70.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ConvBERT-DG	Average	74.6	—	Unverified
2	ConvBERT-DG + Pre + Multi	Average	73.8	—	Unverified
3	mslm	Average	73.49	—	Unverified
4	ConvBERT + Pre + Multi	Average	68.22	—	Unverified
5	BanLanGen	Average	39.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ConvBERT + Pre + Multi	Average	86.89	—	Unverified
2	mslm	Average	85.83	—	Unverified
3	ConvBERT-DG + Pre + Multi	Average	85.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Average	89.9	—	Unverified
2	BERT-LARGE	Average	82.1	—	Unverified