Natural Language Understanding

Natural Language Understanding is an important field of Natural Language Processing which contains various tasks such as text classification, natural language inference and story comprehension. Applications enabled by natural language understanding range from question answering to automated reasoning.

Source: Find a Reasonable Ending for Stories: Does Logic Relation Help the Story Cloze Test?

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 1978 papers

Title	Date	Tasks	Status
Jailbreaking and Mitigation of Vulnerabilities in Large Language Models	Oct 20, 2024	Natural Language Understanding	—Unverified
Large Language Models for Autonomous Driving (LLM4AD): Concept, Benchmark, Experiments, and Challenges	Oct 20, 2024	Autonomous DrivingDecision Making	—Unverified
MediTOD: An English Dialogue Dataset for Medical History Taking with Comprehensive Annotations	Oct 18, 2024	Natural Language UnderstandingTask-Oriented Dialogue Systems	—Unverified
LoLDU: Low-Rank Adaptation via Lower-Diag-Upper Decomposition for Parameter-Efficient Fine-Tuning	Oct 17, 2024	image-classificationImage Classification	CodeCode Available
SLM-Mod: Small Language Models Surpass LLMs at Content Moderation	Oct 17, 2024	Language ModelingLanguage Modelling	CodeCode Available
VL-GLUE: A Suite of Fundamental yet Challenging Visuo-Linguistic Reasoning Tasks	Oct 17, 2024	Natural Language Understanding	CodeCode Available
Enhancing Text Generation in Joint NLG/NLU Learning Through Curriculum Learning, Semi-Supervised Training, and Advanced Optimization Techniques	Oct 17, 2024	Natural Language UnderstandingPOS	—Unverified
PromptExp: Multi-granularity Prompt Explanation of Large Language Models	Oct 16, 2024	Natural Language UnderstandingPrompt Engineering	—Unverified
Expanding Chatbot Knowledge in Customer Service: Context-Aware Similar Question Generation Using Large Language Models	Oct 16, 2024	ChatbotDiversity	—Unverified
SplitLLM: Collaborative Inference of LLMs for Model Placement and Throughput Optimization	Oct 14, 2024	Collaborative InferenceInformation Retrieval	—Unverified
Improving the Language Understanding Capabilities of Large Language Models Using Reinforcement Learning	Oct 14, 2024	Natural Language UnderstandingText Generation	—Unverified
TapWeight: Reweighting Pretraining Objectives for Task-Adaptive Pretraining	Oct 13, 2024	Molecular Property PredictionNatural Language Understanding	—Unverified
BiDoRA: Bi-level Optimization-Based Weight-Decomposed Low-Rank Adaptation	Oct 13, 2024	Natural Language Understandingparameter-efficient fine-tuning	—Unverified
StraGo: Harnessing Strategic Guidance for Prompt Optimization	Oct 11, 2024	In-Context LearningNatural Language Understanding	—Unverified
ACCEPT: Adaptive Codebook for Composite and Efficient Prompt Tuning	Oct 10, 2024	Natural Language Understandingparameter-efficient fine-tuning	CodeCode Available
KRAG Framework for Enhancing LLMs in the Legal Domain	Oct 10, 2024	Legal ReasoningNatural Language Understanding	—Unverified
An Approach for Auto Generation of Labeling Functions for Software Engineering Chatbots	Oct 9, 2024	ChatbotNatural Language Understanding	—Unverified
FltLM: An Intergrated Long-Context Large Language Model for Effective Context Filtering and Understanding	Oct 9, 2024	Language ModelingLanguage Modelling	—Unverified
SpaLLM: Unified Compressive Adaptation of Large Language Models with Sketching	Oct 8, 2024	Model CompressionNatural Language Understanding	—Unverified
Leveraging Grammar Induction for Language Understanding and Generation	Oct 7, 2024	Machine TranslationNatural Language Understanding	CodeCode Available
Collapsed Language Models Promote Fairness	Oct 6, 2024	Data AugmentationFairness	CodeCode Available
LoRTA: Low Rank Tensor Adaptation of Large Language Models	Oct 5, 2024	Natural Language Understandingparameter-efficient fine-tuning	—Unverified
CodePMP: Scalable Preference Model Pretraining for Large Language Model Reasoning	Oct 3, 2024	GSM8KLanguage Modeling	—Unverified
Addition is All You Need for Energy-efficient Language Models	Oct 1, 2024	AllNatural Language Understanding	—Unverified
Experimental Evaluation of Machine Learning Models for Goal-oriented Customer Service Chatbot with Pipeline Architecture	Sep 27, 2024	ChatbotDialogue Management	—Unverified
Robotic-CLIP: Fine-tuning CLIP on Action Data for Robotic Applications	Sep 26, 2024	Contrastive LearningNatural Language Understanding	—Unverified
Towards Enhancing Linked Data Retrieval in Conversational UIs using Large Language Models	Sep 24, 2024	Natural Language UnderstandingRetrieval	CodeCode Available
Improving the Efficiency of Visually Augmented Language Models	Sep 17, 2024	Image GenerationImage Retrieval	CodeCode Available
Safeguarding Decentralized Social Media: LLM Agents for Automating Community Rule Compliance	Sep 13, 2024	Natural Language Understanding	—Unverified
LLM-based Weak Supervision Framework for Query Intent Classification in Video Search	Sep 13, 2024	In-Context Learningintent-classification	—Unverified
Logically Consistent Language Models via Neuro-Symbolic Integration	Sep 9, 2024	Natural Language Understanding	—Unverified
SVFit: Parameter-Efficient Fine-Tuning of Large Pre-Trained Models Using Singular Values	Sep 9, 2024	Domain Adaptationimage-classification	—Unverified
Evaluating Large Language Models with Tests of Spanish as a Foreign Language: Pass or Fail?	Sep 8, 2024	Natural Language UnderstandingReading Comprehension	—Unverified
Large Margin Prototypical Network for Few-shot Relation Classification with Fine-grained Features	Sep 6, 2024	Feature EngineeringFew-Shot Learning	—Unverified
Prompt-based Personality Profiling: Reinforcement Learning for Relevance Filtering	Sep 6, 2024	Author ProfilingNatural Language Understanding	—Unverified
R2GQA: Retriever-Reader-Generator Question Answering System to Support Students Understanding Legal Regulations in Higher Education	Sep 4, 2024	ArticlesInformation Retrieval	—Unverified
LLM-GAN: Construct Generative Adversarial Network Through Large Language Models For Explainable Fake News Detection	Sep 3, 2024	Explanation GenerationFake News Detection	—Unverified
The Dark Side of Human Feedback: Poisoning Large Language Models via User Inputs	Sep 1, 2024	Language ModellingNatural Language Understanding	—Unverified
A Survey for Large Language Models in Biomedicine	Aug 29, 2024	DiagnosticDrug Discovery	—Unverified
Making the Most of your Model: Methods for Finetuning and Applying Pretrained Transformers	Aug 29, 2024	DecoderNatural Language Understanding	—Unverified
EMP: Enhance Memory in Data Pruning	Aug 28, 2024	Contrastive Learningimage-classification	—Unverified
AAVENUE: Detecting LLM Biases on NLU Tasks in AAVE via a Novel Benchmark	Aug 27, 2024	Language ModelingLanguage Modelling	—Unverified
Step-by-Step Unmasking for Parameter-Efficient Fine-tuning of Large Language Models	Aug 26, 2024	Computational EfficiencyNatural Language Understanding	CodeCode Available
Evaluating Large Language Models on Spatial Tasks: A Multi-Task Benchmarking Study	Aug 26, 2024	8kBenchmarking	—Unverified
Toward the Evaluation of Large Language Models Considering Score Variance across Instruction Templates	Aug 22, 2024	Natural Language Understanding	—Unverified
GeoReasoner: Reasoning On Geospatially Grounded Context For Natural Language Understanding	Aug 21, 2024	Entity TypingLanguage Modeling	—Unverified
MIDAS: Multi-level Intent, Domain, And Slot Knowledge Distillation for Multi-turn NLU	Aug 15, 2024	domain classificationIntent Detection	CodeCode Available
Evaluating Fine-Tuning Efficiency of Human-Inspired Learning Strategies in Medical Question Answering	Aug 15, 2024	Medical Question AnsweringNatural Language Understanding	CodeCode Available
Nl2Hltl2Plan: Scaling Up Natural Language Understanding for Multi-Robots Through Hierarchical Temporal Logic Task Representation	Aug 15, 2024	Natural Language UnderstandingRobot Task Planning	—Unverified
Only One Relation Possible? Modeling the Ambiguity in Event Temporal Relation Extraction	Aug 14, 2024	Multi-Label ClassificationMUlTI-LABEL-ClASSIFICATION	—Unverified

Show:10 25 50

← PrevPage 12 of 40Next →

All datasets PDP60 STREUSLE LexGLUE DialoGLUE fewshot DialoGLUE full GLUE

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	HNN	Accuracy	90	—	Unverified
2	BERT-large 340M	Accuracy	78.3	—	Unverified
3	UDSSM-II (ensemble)	Accuracy	78.3	—	Unverified
4	UDSSM-I (ensemble)	Accuracy	76.7	—	Unverified
5	DSSM	Accuracy	75	—	Unverified
6	UDSSM-II	Accuracy	75	—	Unverified
7	BERT-base 110M + MAS	Accuracy	68.3	—	Unverified
8	USSM + Supervised Deepnet + 3 Knowledge Bases	Accuracy	66.7	—	Unverified
9	Word-level CNN+LSTM (full scoring)	Accuracy	60	—	Unverified
10	Subword-level Transformer LM	Accuracy	58.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	BERT (pred POS/lemmas)	Tags (Full) Acc	82.5	—	Unverified
2	BERT (none)	Tags (Full) Acc	82	—	Unverified
3	BERT (gold POS/lemmas)	Tags (Full) Acc	81	—	Unverified
4	GloVe (gold POS/lemmas)	Tags (Full) Acc	79.3	—	Unverified
5	RoBERTa + Linear	Full F1 (Preps)	78.2	—	Unverified
6	GloVe (none)	Tags (Full) Acc	77.5	—	Unverified
7	GloVe (pred POS/lemmas)	Tags (Full) Acc	77.1	—	Unverified
8	SVM (feature-rich, gold syntax)	Role F1 (Preps)	62.2	—	Unverified
9	BiLSTM + MLP (gold syntax)	Role F1 (Preps)	62.2	—	Unverified
10	SVM (feature-rich, auto syntax)	Role F1 (Preps)	58.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	CaseLaw-BERT	CaseHOLD	75.6	—	Unverified
2	Legal-BERT	CaseHOLD	75.1	—	Unverified
3	DeBERTa	CaseHOLD	72.1	—	Unverified
4	Longformer	CaseHOLD	72	—	Unverified
5	RoBERTa	CaseHOLD	71.7	—	Unverified
6	BERT	CaseHOLD	70.7	—	Unverified
7	BigBird	CaseHOLD	70.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ConvBERT-DG	Average	74.6	—	Unverified
2	ConvBERT-DG + Pre + Multi	Average	73.8	—	Unverified
3	mslm	Average	73.49	—	Unverified
4	ConvBERT + Pre + Multi	Average	68.22	—	Unverified
5	BanLanGen	Average	39.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ConvBERT + Pre + Multi	Average	86.89	—	Unverified
2	mslm	Average	85.83	—	Unverified
3	ConvBERT-DG + Pre + Multi	Average	85.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MT-DNN-SMART	Average	89.9	—	Unverified
2	BERT-LARGE	Average	82.1	—	Unverified