Language Modelling

A language model is a model of natural language. Language models are useful for a variety of tasks, including speech recognition, machine translation, natural language generation (generating more human-like text), optical character recognition, route optimization, handwriting recognition, grammar induction, and information retrieval.

Large language models (LLMs), currently their most advanced form, are predominantly based on transformers trained on larger datasets (frequently using words scraped from the public internet). They have superseded recurrent neural network-based models, which had previously superseded the purely statistical models, such as word n-gram language model.

Source: Wikipedia

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 17610 papers

Title	Date	Tasks	Status	Hype
Voice Impression Control in Zero-Shot TTS	Jun 6, 2025	Language ModelingLanguage Modelling	—Unverified	0
Customizing Speech Recognition Model with Large Language Model Feedback	Jun 5, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Zeroth-Order Optimization Finds Flat Minima	Jun 5, 2025	Binary ClassificationLanguage Modeling	—Unverified	0
Accelerated Test-Time Scaling with Model-Free Speculative Sampling	Jun 5, 2025	Language ModelingLanguage Modelling	—Unverified	0
ConECT Dataset: Overcoming Data Scarcity in Context-Aware E-Commerce MT	Jun 5, 2025	Language ModelingLanguage Modelling	—Unverified	0
MesaNet: Sequence Modeling by Locally Optimal Test-Time Training	Jun 5, 2025	Language ModelingLanguage Modelling	—Unverified	0
HALoS: Hierarchical Asynchronous Local SGD over Slow Networks for Geo-Distributed Large Language Model Training	Jun 5, 2025	Language ModelingLanguage Modelling	CodeCode Available	0
E-bike agents: Large Language Model-Driven E-Bike Accident Analysis and Severity Prediction	Jun 5, 2025	Language ModelingLanguage Modelling	—Unverified	0
Improving Low-Resource Morphological Inflection via Self-Supervised Objectives	Jun 5, 2025	DecoderLanguage Modeling	—Unverified	0
Unleashing Hour-Scale Video Training for Long Video-Language Understanding	Jun 5, 2025	Instruction FollowingLanguage Modeling	—Unverified	0
Hierarchical Language Models for Semantic Navigation and Manipulation in an Aerial-Ground Robotic System	Jun 5, 2025	Language ModelingLanguage Modelling	—Unverified	0
The NTNU System at the S&I Challenge 2025 SLA Open Track	Jun 5, 2025	Language ModelingLanguage Modelling	—Unverified	0
LESS: Large Language Model Enhanced Semi-Supervised Learning for Speech Foundational Models	Jun 5, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
OpenMaskDINO3D : Reasoning 3D Segmentation via Large Language Model	Jun 5, 2025	Instance SegmentationLanguage Modeling	CodeCode Available	1
HoliSafe: Holistic Safety Benchmarking and Modeling with Safety Meta Token for Vision-Language Model	Jun 5, 2025	BenchmarkingLanguage Modeling	—Unverified	0
Clustering and Median Aggregation Improve Differentially Private Inference	Jun 5, 2025	ClusteringLanguage Modeling	—Unverified	0
Exp4Fuse: A Rank Fusion Framework for Enhanced Sparse Retrieval using Large Language Model-based Query Expansion	Jun 5, 2025	Information RetrievalLanguage Modeling	CodeCode Available	0
Handle-based Mesh Deformation Guided By Vision Language Model	Jun 5, 2025	Language ModelingLanguage Modelling	—Unverified	0
Robust Few-Shot Vision-Language Model Adaptation	Jun 5, 2025	Language ModelingLanguage Modelling	—Unverified	0
Sparse Autoencoders, Again?	Jun 5, 2025	Language ModelingLanguage Modelling	—Unverified	0
Go-Browse: Training Web Agents with Structured Exploration	Jun 4, 2025	Efficient ExplorationLanguage Modeling	—Unverified	0
Debate, Reflect, and Distill: Multi-Agent Feedback with Tree-Structured Preference Optimization for Efficient Language Model Enhancement	Jun 4, 2025	Knowledge DistillationLanguage Modeling	—Unverified	0
Phi-Omni-ST: A multimodal language model for direct speech-to-speech translation	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified	0
Evaluating Large Language Model Capabilities in Assessing Spatial Econometrics Research	Jun 4, 2025	counterfactualEconometrics	—Unverified	0
POSS: Position Specialist Generates Better Draft for Speculative Decoding	Jun 4, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
EuroLLM-9B: Technical Report	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified	0
MedAgentGym: Training LLM Agents for Code-Based Medical Reasoning at Scale	Jun 4, 2025	BenchmarkingLanguage Modeling	—Unverified	0
MELABenchv1: Benchmarking Large Language Models against Smaller Fine-Tuned Models for Low-Resource Maltese NLP	Jun 4, 2025	BenchmarkingLanguage Modelling	—Unverified	0
Rectified Sparse Attention	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified	0
A Statistical Physics of Language Model Reasoning	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified	0
Towards Efficient Speech-Text Jointly Decoding within One Speech Language Model	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified	0
KOALA++: Efficient Kalman-Based Optimization of Neural Networks with Gradient-Covariance Products	Jun 4, 2025	image-classificationImage Classification	—Unverified	0
"Don't Do That!": Guiding Embodied Systems through Large Language Model-based Constraint Generation	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified	0
A Novel Data Augmentation Approach for Automatic Speaking Assessment on Opinion Expressions	Jun 4, 2025	Data AugmentationDiversity	—Unverified	0
LaF-GRPO: In-Situ Navigation Instruction Generation for the Visually Impaired via GRPO with LLM-as-Follower Reward	Jun 4, 2025	Language ModelingLanguage Modelling	CodeCode Available	0
Think Like a Person Before Responding: A Multi-Faceted Evaluation of Persona-Guided LLMs for Countering Hate	Jun 4, 2025	Language ModelingLanguage Modelling	CodeCode Available	0
Understanding and Meeting Practitioner Needs When Measuring Representational Harms Caused by LLM-Based Systems	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified	0
Evaluating Apple Intelligence's Writing Tools for Privacy Against Large Language Model-Based Inference Attacks: Insights from Early Datasets	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified	0
MASTER: Enhancing Large Language Model via Multi-Agent Simulated Teaching	Jun 3, 2025	Data AugmentationInstruction Following	—Unverified	0
EALG: Evolutionary Adversarial Generation of Language Model-Guided Generators for Combinatorial Optimization	Jun 3, 2025	Combinatorial OptimizationLanguage Modeling	—Unverified	0
IMPARA-GED: Grammatical Error Detection is Boosting Reference-free Grammatical Error Quality Estimator	Jun 3, 2025	Grammatical Error CorrectionGrammatical Error Detection	—Unverified	0
Trajectory Prediction Meets Large Language Models: A Survey	Jun 3, 2025	Language ModelingLanguage Modelling	CodeCode Available	5
A Smart Multimodal Healthcare Copilot with Powerful LLM Reasoning	Jun 3, 2025	Decision MakingDiagnostic	CodeCode Available	3
TaxAgent: How Large Language Model Designs Fiscal Policy	Jun 3, 2025	Language ModelingLanguage Modelling	—Unverified	0
TalkingMachines: Real-Time Audio-Driven FaceTime-Style Video via Autoregressive Diffusion Models	Jun 3, 2025	DecoderKnowledge Distillation	—Unverified	0
Beyond Text Compression: Evaluating Tokenizers Across Scales	Jun 3, 2025	Language ModelingLanguage Modelling	—Unverified	0
SurgVLM: A Large Vision-Language Model and Systematic Evaluation Benchmark for Surgical Intelligence	Jun 3, 2025	Language ModelingLanguage Modelling	—Unverified	0
PGPO: Enhancing Agent Reasoning via Pseudocode-style Planning Guided Preference Optimization	Jun 2, 2025	Language ModelingLanguage Modelling	—Unverified	0
The State of Large Language Models for African Languages: Progress and Challenges	Jun 2, 2025	Language Modelling	—Unverified	0
Hybrid AI for Responsive Multi-Turn Online Conversations with Novel Dynamic Routing and Feedback Adaptation	Jun 2, 2025	Language ModelingLanguage Modelling	—Unverified	0

Show:10 25 50

← PrevPage 5 of 353Next →

All datasets WikiText-103 Penn Treebank (Word Level)enwik8 The Pile WikiText-2 LAMBADA One Billion Word Text8 Penn Treebank (Character Level)Hutter Prize OpenWebText SALMon

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Decay RNN	Validation perplexity	76.67	—	Unverified
2	GRU	Validation perplexity	53.78	—	Unverified
3	LSTM	Validation perplexity	52.73	—	Unverified
4	LSTM	Test perplexity	48.7	—	Unverified
5	Temporal CNN	Test perplexity	45.2	—	Unverified
6	TCN	Test perplexity	45.19	—	Unverified
7	GCNN-8	Test perplexity	44.9	—	Unverified
8	Neural cache model (size = 100)	Test perplexity	44.8	—	Unverified
9	Neural cache model (size = 2,000)	Test perplexity	40.8	—	Unverified
10	GPT-2 Small	Test perplexity	37.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TCN	Test perplexity	108.47	—	Unverified
2	Seq-U-Net	Test perplexity	107.95	—	Unverified
3	GRU (Bai et al., 2018)	Test perplexity	92.48	—	Unverified
4	R-Transformer	Test perplexity	84.38	—	Unverified
5	Zaremba et al. (2014) - LSTM (medium)	Test perplexity	82.7	—	Unverified
6	Gal & Ghahramani (2016) - Variational LSTM (medium)	Test perplexity	79.7	—	Unverified
7	LSTM (Bai et al., 2018)	Test perplexity	78.93	—	Unverified
8	Zaremba et al. (2014) - LSTM (large)	Test perplexity	78.4	—	Unverified
9	Gal & Ghahramani (2016) - Variational LSTM (large)	Test perplexity	75.2	—	Unverified
10	Inan et al. (2016) - Variational RHN	Test perplexity	66	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSTM (7 layers)	Bit per Character (BPC)	1.67	—	Unverified
2	Hypernetworks	Bit per Character (BPC)	1.34	—	Unverified
3	SHA-LSTM (4 layers, h=1024, no attention head)	Bit per Character (BPC)	1.33	—	Unverified
4	LN HM-LSTM	Bit per Character (BPC)	1.32	—	Unverified
5	ByteNet	Bit per Character (BPC)	1.31	—	Unverified
6	Recurrent Highway Networks	Bit per Character (BPC)	1.27	—	Unverified
7	Large FS-LSTM-4	Bit per Character (BPC)	1.25	—	Unverified
8	Large mLSTM	Bit per Character (BPC)	1.24	—	Unverified
9	AWD-LSTM (3 layers)	Bit per Character (BPC)	1.23	—	Unverified
10	Cluster-Former (#C=512)	Bit per Character (BPC)	1.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Smaller Transformer 126M (pre-trained)	Test perplexity	33	—	Unverified
2	OPT 125M	Test perplexity	32.26	—	Unverified
3	Larger Transformer 771M (pre-trained)	Test perplexity	28.1	—	Unverified
4	OPT 1.3B	Test perplexity	19.55	—	Unverified
5	GPT-Neo 125M	Test perplexity	17.83	—	Unverified
6	OPT 2.7B	Test perplexity	17.81	—	Unverified
7	Smaller Transformer 126M (fine-tuned)	Test perplexity	12	—	Unverified
8	GPT-Neo 1.3B	Test perplexity	11.46	—	Unverified
9	Transformer 125M	Test perplexity	10.7	—	Unverified
10	GPT-Neo 2.7B	Test perplexity	10.44	—	Unverified