Language Modelling

A language model is a model of natural language. Language models are useful for a variety of tasks, including speech recognition, machine translation, natural language generation (generating more human-like text), optical character recognition, route optimization, handwriting recognition, grammar induction, and information retrieval.

Large language models (LLMs), currently their most advanced form, are predominantly based on transformers trained on larger datasets (frequently using words scraped from the public internet). They have superseded recurrent neural network-based models, which had previously superseded the purely statistical models, such as word n-gram language model.

Source: Wikipedia

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4201–4250 of 17610 papers

Title	Date	Tasks	Status
Event-Priori-Based Vision-Language Model for Efficient Visual Understanding	Jun 9, 2025	Event-based visionLanguage Modeling	—Unverified
Private Memorization Editing: Turning Memorization into a Defense to Strengthen Data Privacy in Large Language Models	Jun 9, 2025	Language ModelingLanguage Modelling	CodeCode Available
Scaling Laws of Motion Forecasting and Planning -- A Technical Report	Jun 9, 2025	Autonomous DrivingLanguage Modeling	—Unverified
A Good CREPE needs more than just Sugar: Investigating Biases in Compositional Vision-Language Benchmarks	Jun 9, 2025	Language ModelingLanguage Modelling	—Unverified
A Hybrid GA LLM Framework for Structured Task Optimization	Jun 9, 2025	global-optimizationLanguage Modeling	CodeCode Available
AnnoDPO: Protein Functional Annotation Learning with Direct Preference Optimization	Jun 8, 2025	Language ModelingLanguage Modelling	CodeCode Available
Automatic Speech Recognition of African American English: Lexical and Contextual Effects	Jun 7, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
An Agentic Framework for Autonomous Metamaterial Modeling and Inverse Design	Jun 7, 2025	Language ModelingLanguage Modelling	—Unverified
Benchmarking Misuse Mitigation Against Covert Adversaries	Jun 6, 2025	BenchmarkingLanguage Modeling	CodeCode Available
Hierarchical Debate-Based Large Language Model (LLM) for Complex Task Planning of 6G Network Management	Jun 6, 2025	Language ModelingLanguage Modelling	—Unverified
Voice Impression Control in Zero-Shot TTS	Jun 6, 2025	Language ModelingLanguage Modelling	—Unverified
WhisQ: Cross-Modal Representation Learning for Text-to-Music MOS Prediction	Jun 6, 2025	cross-modal alignmentLanguage Modeling	—Unverified
Training-Free Query Optimization via LLM-Based Plan Similarity	Jun 6, 2025	Language ModelingLanguage Modelling	—Unverified
Label-Context-Dependent Internal Language Model Estimation for CTC	Jun 6, 2025	Knowledge DistillationLanguage Modeling	—Unverified
Masked Language Models are Good Heterogeneous Graph Generalizers	Jun 6, 2025	Graph LearningLanguage Modeling	CodeCode Available
PersonaAgent: When Large Language Model Agents Meet Personalization at Test Time	Jun 6, 2025	Language ModelingLanguage Modelling	—Unverified
The NTNU System at the S&I Challenge 2025 SLA Open Track	Jun 5, 2025	Language ModelingLanguage Modelling	—Unverified
LESS: Large Language Model Enhanced Semi-Supervised Learning for Speech Foundational Models	Jun 5, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Robust Few-Shot Vision-Language Model Adaptation	Jun 5, 2025	Language ModelingLanguage Modelling	—Unverified
Sparse Autoencoders, Again?	Jun 5, 2025	Language ModelingLanguage Modelling	—Unverified
MesaNet: Sequence Modeling by Locally Optimal Test-Time Training	Jun 5, 2025	Language ModelingLanguage Modelling	—Unverified
Handle-based Mesh Deformation Guided By Vision Language Model	Jun 5, 2025	Language ModelingLanguage Modelling	—Unverified
Clustering and Median Aggregation Improve Differentially Private Inference	Jun 5, 2025	ClusteringLanguage Modeling	—Unverified
Hierarchical Language Models for Semantic Navigation and Manipulation in an Aerial-Ground Robotic System	Jun 5, 2025	Language ModelingLanguage Modelling	—Unverified
HALoS: Hierarchical Asynchronous Local SGD over Slow Networks for Geo-Distributed Large Language Model Training	Jun 5, 2025	Language ModelingLanguage Modelling	CodeCode Available
Improving Low-Resource Morphological Inflection via Self-Supervised Objectives	Jun 5, 2025	DecoderLanguage Modeling	—Unverified
ConECT Dataset: Overcoming Data Scarcity in Context-Aware E-Commerce MT	Jun 5, 2025	Language ModelingLanguage Modelling	—Unverified
Exp4Fuse: A Rank Fusion Framework for Enhanced Sparse Retrieval using Large Language Model-based Query Expansion	Jun 5, 2025	Information RetrievalLanguage Modeling	CodeCode Available
Accelerated Test-Time Scaling with Model-Free Speculative Sampling	Jun 5, 2025	Language ModelingLanguage Modelling	—Unverified
HoliSafe: Holistic Safety Benchmarking and Modeling with Safety Meta Token for Vision-Language Model	Jun 5, 2025	BenchmarkingLanguage Modeling	—Unverified
E-bike agents: Large Language Model-Driven E-Bike Accident Analysis and Severity Prediction	Jun 5, 2025	Language ModelingLanguage Modelling	—Unverified
Customizing Speech Recognition Model with Large Language Model Feedback	Jun 5, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Unleashing Hour-Scale Video Training for Long Video-Language Understanding	Jun 5, 2025	Instruction FollowingLanguage Modeling	—Unverified
Zeroth-Order Optimization Finds Flat Minima	Jun 5, 2025	Binary ClassificationLanguage Modeling	—Unverified
Rectified Sparse Attention	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified
Understanding and Meeting Practitioner Needs When Measuring Representational Harms Caused by LLM-Based Systems	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified
LaF-GRPO: In-Situ Navigation Instruction Generation for the Visually Impaired via GRPO with LLM-as-Follower Reward	Jun 4, 2025	Language ModelingLanguage Modelling	CodeCode Available
MELABenchv1: Benchmarking Large Language Models against Smaller Fine-Tuned Models for Low-Resource Maltese NLP	Jun 4, 2025	BenchmarkingLanguage Modelling	—Unverified
Think Like a Person Before Responding: A Multi-Faceted Evaluation of Persona-Guided LLMs for Countering Hate	Jun 4, 2025	Language ModelingLanguage Modelling	CodeCode Available
Phi-Omni-ST: A multimodal language model for direct speech-to-speech translation	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified
MedAgentGym: Training LLM Agents for Code-Based Medical Reasoning at Scale	Jun 4, 2025	BenchmarkingLanguage Modeling	—Unverified
A Statistical Physics of Language Model Reasoning	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified
EuroLLM-9B: Technical Report	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified
Go-Browse: Training Web Agents with Structured Exploration	Jun 4, 2025	Efficient ExplorationLanguage Modeling	—Unverified
KOALA++: Efficient Kalman-Based Optimization of Neural Networks with Gradient-Covariance Products	Jun 4, 2025	image-classificationImage Classification	—Unverified
A Novel Data Augmentation Approach for Automatic Speaking Assessment on Opinion Expressions	Jun 4, 2025	Data AugmentationDiversity	—Unverified
Towards Efficient Speech-Text Jointly Decoding within One Speech Language Model	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified
Debate, Reflect, and Distill: Multi-Agent Feedback with Tree-Structured Preference Optimization for Efficient Language Model Enhancement	Jun 4, 2025	Knowledge DistillationLanguage Modeling	—Unverified
"Don't Do That!": Guiding Embodied Systems through Large Language Model-based Constraint Generation	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified
Evaluating Large Language Model Capabilities in Assessing Spatial Econometrics Research	Jun 4, 2025	counterfactualEconometrics	—Unverified

Show:10 25 50

← PrevPage 85 of 353Next →

All datasets WikiText-103 Penn Treebank (Word Level)enwik8 The Pile WikiText-2 LAMBADA One Billion Word Text8 Penn Treebank (Character Level)Hutter Prize OpenWebText SALMon

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Decay RNN	Validation perplexity	76.67	—	Unverified
2	GRU	Validation perplexity	53.78	—	Unverified
3	LSTM	Validation perplexity	52.73	—	Unverified
4	LSTM	Test perplexity	48.7	—	Unverified
5	Temporal CNN	Test perplexity	45.2	—	Unverified
6	TCN	Test perplexity	45.19	—	Unverified
7	GCNN-8	Test perplexity	44.9	—	Unverified
8	Neural cache model (size = 100)	Test perplexity	44.8	—	Unverified
9	Neural cache model (size = 2,000)	Test perplexity	40.8	—	Unverified
10	GPT-2 Small	Test perplexity	37.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TCN	Test perplexity	108.47	—	Unverified
2	Seq-U-Net	Test perplexity	107.95	—	Unverified
3	GRU (Bai et al., 2018)	Test perplexity	92.48	—	Unverified
4	R-Transformer	Test perplexity	84.38	—	Unverified
5	Zaremba et al. (2014) - LSTM (medium)	Test perplexity	82.7	—	Unverified
6	Gal & Ghahramani (2016) - Variational LSTM (medium)	Test perplexity	79.7	—	Unverified
7	LSTM (Bai et al., 2018)	Test perplexity	78.93	—	Unverified
8	Zaremba et al. (2014) - LSTM (large)	Test perplexity	78.4	—	Unverified
9	Gal & Ghahramani (2016) - Variational LSTM (large)	Test perplexity	75.2	—	Unverified
10	Inan et al. (2016) - Variational RHN	Test perplexity	66	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSTM (7 layers)	Bit per Character (BPC)	1.67	—	Unverified
2	Hypernetworks	Bit per Character (BPC)	1.34	—	Unverified
3	SHA-LSTM (4 layers, h=1024, no attention head)	Bit per Character (BPC)	1.33	—	Unverified
4	LN HM-LSTM	Bit per Character (BPC)	1.32	—	Unverified
5	ByteNet	Bit per Character (BPC)	1.31	—	Unverified
6	Recurrent Highway Networks	Bit per Character (BPC)	1.27	—	Unverified
7	Large FS-LSTM-4	Bit per Character (BPC)	1.25	—	Unverified
8	Large mLSTM	Bit per Character (BPC)	1.24	—	Unverified
9	AWD-LSTM (3 layers)	Bit per Character (BPC)	1.23	—	Unverified
10	Cluster-Former (#C=512)	Bit per Character (BPC)	1.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Smaller Transformer 126M (pre-trained)	Test perplexity	33	—	Unverified
2	OPT 125M	Test perplexity	32.26	—	Unverified
3	Larger Transformer 771M (pre-trained)	Test perplexity	28.1	—	Unverified
4	OPT 1.3B	Test perplexity	19.55	—	Unverified
5	GPT-Neo 125M	Test perplexity	17.83	—	Unverified
6	OPT 2.7B	Test perplexity	17.81	—	Unverified
7	Smaller Transformer 126M (fine-tuned)	Test perplexity	12	—	Unverified
8	GPT-Neo 1.3B	Test perplexity	11.46	—	Unverified
9	Transformer 125M	Test perplexity	10.7	—	Unverified
10	GPT-Neo 2.7B	Test perplexity	10.44	—	Unverified