Language Modelling

A language model is a model of natural language. Language models are useful for a variety of tasks, including speech recognition, machine translation, natural language generation (generating more human-like text), optical character recognition, route optimization, handwriting recognition, grammar induction, and information retrieval.

Large language models (LLMs), currently their most advanced form, are predominantly based on transformers trained on larger datasets (frequently using words scraped from the public internet). They have superseded recurrent neural network-based models, which had previously superseded the purely statistical models, such as word n-gram language model.

Source: Wikipedia

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4701–4750 of 17610 papers

Title	Date	Tasks	Status
MoxE: Mixture of xLSTM Experts with Entropy-Aware Routing for Efficient Language Modeling	May 1, 2025	Language ModelingLanguage Modelling	—Unverified
KoACD: The First Korean Adolescent Dataset for Cognitive Distortion Analysis	May 1, 2025	Language ModelingLanguage Modelling	—Unverified
Red Teaming Large Language Models for Healthcare	May 1, 2025	Language ModelingLanguage Modelling	—Unverified
Patchwork: A Unified Framework for RAG Serving	May 1, 2025	Language ModelingLanguage Modelling	—Unverified
Optimizing Deep Neural Networks using Safety-Guided Self Compression	May 1, 2025	Language ModelingLanguage Modelling	CodeCode Available
Sadeed: Advancing Arabic Diacritization Through Small Language Model	Apr 30, 2025	Arabic Text DiacritizationBenchmarking	—Unverified
Polysemy of Synthetic Neurons Towards a New Type of Explanatory Categorical Vector Spaces	Apr 30, 2025	Language ModelingLanguage Modelling	—Unverified
Does the Prompt-based Large Language Model Recognize Students' Demographics and Introduce Bias in Essay Scoring?	Apr 30, 2025	Automated Essay ScoringFairness	—Unverified
Confidence in Large Language Model Evaluation: A Bayesian Approach to Limited-Sample Challenges	Apr 30, 2025	Bayesian InferenceLanguage Model Evaluation	—Unverified
Vision-Language Model-Based Semantic-Guided Imaging Biomarker for Early Lung Cancer Detection	Apr 30, 2025	Language ModelingLanguage Modelling	—Unverified
V3LMA: Visual 3D-enhanced Language Model for Autonomous Driving	Apr 30, 2025	Autonomous DrivingDecision Making	—Unverified
WenyanGPT: A Large Language Model for Classical Chinese Tasks	Apr 29, 2025	Language ModelingLanguage Modelling	—Unverified
Universal language model with the intervention of quantum theory	Apr 29, 2025	Language ModelingLanguage Modelling	—Unverified
UniDetox: Universal Detoxification of Large Language Models via Dataset Distillation	Apr 29, 2025	Dataset DistillationLanguage Modeling	CodeCode Available
Pretraining Large Brain Language Model for Active BCI: Silent Speech	Apr 29, 2025	Brain Computer InterfaceEEG	—Unverified
Computational Reasoning of Large Language Models	Apr 29, 2025	Code GenerationLanguage Modeling	CodeCode Available
LLM Enhancer: Merged Approach using Vector Embedding for Reducing Large Language Model Hallucinations with External Knowledge	Apr 29, 2025	Language ModelingLanguage Modelling	—Unverified
LLM-Enabled EV Charging Stations Recommendation	Apr 29, 2025	Language ModelingLanguage Modelling	—Unverified
Small or Large? Zero-Shot or Finetuned? Guiding Language Model Choice for Specialized Applications in Healthcare	Apr 29, 2025	Language ModelingLanguage Modelling	—Unverified
MemeBLIP2: A novel lightweight multimodal system to detect harmful memes	Apr 29, 2025	Language ModelingLanguage Modelling	—Unverified
From Attention to Atoms: Spectral Dictionary Learning for Fast, Interpretable Language Models	Apr 29, 2025	Dictionary LearningLanguage Modeling	—Unverified
CoCo-Bench: A Comprehensive Code Benchmark For Multi-task Large Language Model Evaluation	Apr 29, 2025	Code GenerationLanguage Model Evaluation	—Unverified
A Framework to Assess the Persuasion Risks Large Language Model Chatbots Pose to Democratic Societies	Apr 29, 2025	Language ModelingLanguage Modelling	—Unverified
BrAIcht, a theatrical agent that speaks like Bertolt Brecht's characters	Apr 29, 2025	Language ModelingLanguage Modelling	—Unverified
An Automated Reinforcement Learning Reward Design Framework with Large Language Model for Cooperative Platoon Coordination	Apr 28, 2025	Code GenerationHallucination	—Unverified
Efficient Domain-adaptive Continual Pretraining for the Process Industry in the German Language	Apr 28, 2025	Continual PretrainingGPU	—Unverified
CodeBC: A More Secure Large Language Model for Smart Contract Code Generation in Blockchain	Apr 28, 2025	Code GenerationLanguage Modeling	CodeCode Available
Fitness Landscape of Large Language Model-Assisted Automated Algorithm Search	Apr 28, 2025	Combinatorial OptimizationLanguage Modeling	—Unverified
GVPO: Group Variance Policy Optimization for Large Language Model Post-Training	Apr 28, 2025	Language ModelingLanguage Modelling	—Unverified
GenTorrent: Scaling Large Language Model Serving with An Overley Network	Apr 27, 2025	Language ModelingLanguage Modelling	—Unverified
Unified Multi-Task Learning & Model Fusion for Efficient Language Model Guardrailing	Apr 27, 2025	Language ModelingLanguage Modelling	—Unverified
Exploring a Large Language Model for Transforming Taxonomic Data into OWL: Lessons Learned and Implications for Ontology Development	Apr 25, 2025	Language ModelingLanguage Modelling	—Unverified
Improving Language Model Personas via Rationalization with Psychological Scaffolds	Apr 25, 2025	Language ModelingLanguage Modelling	—Unverified
Fast-Slow Thinking for Large Vision-Language Model Reasoning	Apr 25, 2025	Language ModelingLanguage Modelling	—Unverified
SMARTFinRAG: Interactive Modularized Financial RAG Benchmark	Apr 25, 2025	Language ModelingLanguage Modelling	CodeCode Available
The Big Send-off: High Performance Collectives on GPU-based Supercomputers	Apr 25, 2025	GPULanguage Modeling	—Unverified
Towards Leveraging Large Language Model Summaries for Topic Modeling in Source Code	Apr 24, 2025	Code SearchLanguage Modeling	—Unverified
TimeSoccer: An End-to-End Multimodal Large Language Model for Soccer Commentary Generation	Apr 24, 2025	Caption GenerationDense Video Captioning	—Unverified
Unified Attacks to Large Language Model Watermarks: Spoofing and Scrubbing in Unauthorized Knowledge Distillation	Apr 24, 2025	Knowledge DistillationLanguage Modeling	—Unverified
Automatically Generating Rules of Malicious Software Packages via Large Language Model	Apr 24, 2025	Language ModelingLanguage Modelling	—Unverified
FashionM3: Multimodal, Multitask, and Multiround Fashion Assistant based on Unified Vision-Language Model	Apr 24, 2025	Image GenerationLanguage Modeling	—Unverified
Does Knowledge Distillation Matter for Large Language Model based Bundle Generation?	Apr 24, 2025	In-Context LearningKnowledge Distillation	—Unverified
Improving Significant Wave Height Prediction Using Chronos Models	Apr 23, 2025	Computational EfficiencyLanguage Modeling	—Unverified
In-Context Learning can distort the relationship between sequence likelihoods and biological fitness	Apr 23, 2025	In-Context LearningLanguage Modeling	—Unverified
Planning with Diffusion Models for Target-Oriented Dialogue Systems	Apr 23, 2025	Language ModelingLanguage Modelling	—Unverified
SplitReason: Learning To Offload Reasoning	Apr 23, 2025	Language ModelingLanguage Modelling	—Unverified
ParamΔ for Direct Weight Mixing: Post-Train Large Language Model at Zero Cost	Apr 23, 2025	Instruction FollowingLanguage Modeling	—Unverified
Target Concrete Score Matching: A Holistic Framework for Discrete Diffusion	Apr 23, 2025	Language ModelingLanguage Modelling	—Unverified
Monte Carlo Planning with Large Language Model for Text-Based Game Agents	Apr 23, 2025	Language ModelingLanguage Modelling	—Unverified
Large Language Model Empowered Privacy-Protected Framework for PHI Annotation in Clinical Notes	Apr 22, 2025	De-identificationLanguage Modeling	—Unverified

Show:10 25 50

← PrevPage 95 of 353Next →

All datasets WikiText-103 Penn Treebank (Word Level)enwik8 The Pile WikiText-2 LAMBADA One Billion Word Text8 Penn Treebank (Character Level)Hutter Prize OpenWebText SALMon

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Decay RNN	Validation perplexity	76.67	—	Unverified
2	GRU	Validation perplexity	53.78	—	Unverified
3	LSTM	Validation perplexity	52.73	—	Unverified
4	LSTM	Test perplexity	48.7	—	Unverified
5	Temporal CNN	Test perplexity	45.2	—	Unverified
6	TCN	Test perplexity	45.19	—	Unverified
7	GCNN-8	Test perplexity	44.9	—	Unverified
8	Neural cache model (size = 100)	Test perplexity	44.8	—	Unverified
9	Neural cache model (size = 2,000)	Test perplexity	40.8	—	Unverified
10	GPT-2 Small	Test perplexity	37.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TCN	Test perplexity	108.47	—	Unverified
2	Seq-U-Net	Test perplexity	107.95	—	Unverified
3	GRU (Bai et al., 2018)	Test perplexity	92.48	—	Unverified
4	R-Transformer	Test perplexity	84.38	—	Unverified
5	Zaremba et al. (2014) - LSTM (medium)	Test perplexity	82.7	—	Unverified
6	Gal & Ghahramani (2016) - Variational LSTM (medium)	Test perplexity	79.7	—	Unverified
7	LSTM (Bai et al., 2018)	Test perplexity	78.93	—	Unverified
8	Zaremba et al. (2014) - LSTM (large)	Test perplexity	78.4	—	Unverified
9	Gal & Ghahramani (2016) - Variational LSTM (large)	Test perplexity	75.2	—	Unverified
10	Inan et al. (2016) - Variational RHN	Test perplexity	66	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSTM (7 layers)	Bit per Character (BPC)	1.67	—	Unverified
2	Hypernetworks	Bit per Character (BPC)	1.34	—	Unverified
3	SHA-LSTM (4 layers, h=1024, no attention head)	Bit per Character (BPC)	1.33	—	Unverified
4	LN HM-LSTM	Bit per Character (BPC)	1.32	—	Unverified
5	ByteNet	Bit per Character (BPC)	1.31	—	Unverified
6	Recurrent Highway Networks	Bit per Character (BPC)	1.27	—	Unverified
7	Large FS-LSTM-4	Bit per Character (BPC)	1.25	—	Unverified
8	Large mLSTM	Bit per Character (BPC)	1.24	—	Unverified
9	AWD-LSTM (3 layers)	Bit per Character (BPC)	1.23	—	Unverified
10	Cluster-Former (#C=512)	Bit per Character (BPC)	1.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Smaller Transformer 126M (pre-trained)	Test perplexity	33	—	Unverified
2	OPT 125M	Test perplexity	32.26	—	Unverified
3	Larger Transformer 771M (pre-trained)	Test perplexity	28.1	—	Unverified
4	OPT 1.3B	Test perplexity	19.55	—	Unverified
5	GPT-Neo 125M	Test perplexity	17.83	—	Unverified
6	OPT 2.7B	Test perplexity	17.81	—	Unverified
7	Smaller Transformer 126M (fine-tuned)	Test perplexity	12	—	Unverified
8	GPT-Neo 1.3B	Test perplexity	11.46	—	Unverified
9	Transformer 125M	Test perplexity	10.7	—	Unverified
10	GPT-Neo 2.7B	Test perplexity	10.44	—	Unverified