Language Modelling

A language model is a model of natural language. Language models are useful for a variety of tasks, including speech recognition, machine translation, natural language generation (generating more human-like text), optical character recognition, route optimization, handwriting recognition, grammar induction, and information retrieval.

Large language models (LLMs), currently their most advanced form, are predominantly based on transformers trained on larger datasets (frequently using words scraped from the public internet). They have superseded recurrent neural network-based models, which had previously superseded the purely statistical models, such as word n-gram language model.

Source: Wikipedia

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 901–950 of 17610 papers

Title	Date	Tasks	Status	Hype
GNN-ACLP: Graph Neural Networks based Analog Circuit Link Prediction	Apr 14, 2025	Language ModelingLanguage Modelling	—Unverified	0
SegEarth-R1: Geospatial Pixel Reasoning via Large Language Model	Apr 13, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
Domain-Adaptive Continued Pre-Training of Small Language Models	Apr 13, 2025	Domain AdaptationHellaSwag	—Unverified	0
Kongzi: A Historical Large Language Model with Fact Enhancement	Apr 13, 2025	Language ModelingLanguage Modelling	—Unverified	0
Vision-Language Model for Object Detection and Segmentation: A Review and Evaluation	Apr 13, 2025	Domain AdaptationLanguage Modeling	CodeCode Available	2
ClinicalGPT-R1: Pushing reasoning capability of generalist disease diagnosis with large language model	Apr 13, 2025	DiagnosticLanguage Modeling	CodeCode Available	2
UXAgent: A System for Simulating Usability Testing of Web Design with LLM Agents	Apr 13, 2025	Language ModelingLanguage Modelling	—Unverified	0
Structure-Accurate Medical Image Translation via Dynamic Frequency Balance and Knowledge Guidance	Apr 13, 2025	Clinical KnowledgeLanguage Modeling	—Unverified	0
AgentDynEx: Nudging the Mechanics and Dynamics of Multi-Agent Simulations	Apr 13, 2025	Language ModelingLanguage Modelling	—Unverified	0
AgentA/B: Automated and Scalable Web A/BTesting with Interactive LLM Agents	Apr 13, 2025	Language ModelingLanguage Modelling	—Unverified	0
Fine-tuning a Large Language Model for Automating Computational Fluid Dynamics Simulations	Apr 13, 2025	Computational EfficiencyLanguage Modeling	CodeCode Available	1
Parameterized Synthetic Text Generation with SimpleStories	Apr 12, 2025	DiversityLanguage Modeling	CodeCode Available	1
PACT: Pruning and Clustering-Based Token Reduction for Faster Visual Language Models	Apr 11, 2025	ClusteringLanguage Modeling	CodeCode Available	2
Large Language Model Empowered Recommendation Meets All-domain Continual Pre-Training	Apr 11, 2025	AllLanguage Modeling	—Unverified	0
Spatial Audio Processing with Large Language Model on Wearable Devices	Apr 11, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
ELSA: A Style Aligned Dataset for Emotionally Intelligent Language Generation	Apr 11, 2025	DiversityLanguage Modeling	—Unverified	0
SWAN-GPT: An Efficient and Scalable Approach for Long-Context Language Modeling	Apr 11, 2025	DecoderLanguage Modeling	—Unverified	0
TP-RAG: Benchmarking Retrieval-Augmented Large Language Model Agents for Spatiotemporal-Aware Travel Planning	Apr 11, 2025	BenchmarkingLanguage Modeling	—Unverified	0
MedRep: Medical Concept Representation for General Electronic Health Record Foundation Models	Apr 11, 2025	Data AugmentationLanguage Modeling	CodeCode Available	0
Bringing Structure to Naturalness: On the Naturalness of ASTs	Apr 11, 2025	Feature EngineeringLanguage Modelling	—Unverified	0
SpecEE: Accelerating Large Language Model Inference with Speculative Early Exiting	Apr 11, 2025	GPULanguage Modeling	—Unverified	0
AstroLLaVA: towards the unification of astronomical data and natural language	Apr 11, 2025	AstronomyImage Captioning	—Unverified	0
EO-VLM: VLM-Guided Energy Overload Attacks on Vision Models	Apr 11, 2025	Autonomous DrivingGPU	—Unverified	0
Data Metabolism: An Efficient Data Design Schema For Vision Language Model	Apr 10, 2025	Language ModelingLanguage Modelling	—Unverified	0
JEPA4Rec: Learning Effective Language Representations for Sequential Recommendation via Joint Embedding Predictive Architecture	Apr 10, 2025	Common Sense ReasoningDescriptive	—Unverified	0
Investigating Vision-Language Model for Point Cloud-based Vehicle Classification	Apr 10, 2025	Autonomous DrivingClassification	—Unverified	0
Beyond LLMs: A Linguistic Approach to Causal Graph Generation from Narrative Texts	Apr 10, 2025	Graph GenerationLanguage Modeling	—Unverified	0
VLM-R1: A Stable and Generalizable R1-style Large Vision-Language Model	Apr 10, 2025	Language ModelingLanguage Modelling	CodeCode Available	9
Cat, Rat, Meow: On the Alignment of Language Model and Human Term-Similarity Judgments	Apr 10, 2025	Language ModelingLanguage Modelling	—Unverified	0
Synthetic Fluency: Hallucinations, Confabulations, and the Creation of Irish Words in LLM-Generated Translations	Apr 10, 2025	Language ModelingLanguage Modelling	—Unverified	0
An LLM-Driven Multi-Agent Debate System for Mendelian Diseases	Apr 10, 2025	DiagnosticLanguage Modeling	—Unverified	0
LauraTSE: Target Speaker Extraction using Auto-Regressive Decoder-Only Language Models	Apr 10, 2025	DecoderLanguage Modeling	CodeCode Available	1
GLUS: Global-Local Reasoning Unified into A Single Large Language Model for Video Segmentation	Apr 10, 2025	Contrastive LearningLanguage Modeling	CodeCode Available	2
DeepGreen: Effective LLM-Driven Green-washing Monitoring System Designed for Empirical Testing -- Evidence from China	Apr 10, 2025	Language ModelingLanguage Modelling	—Unverified	0
Token Level Routing Inference System for Edge Devices	Apr 10, 2025	Language ModelingLanguage Modelling	—Unverified	0
OLMoTrace: Tracing Language Model Outputs Back to Trillions of Training Tokens	Apr 9, 2025	Fact CheckingHallucination	—Unverified	0
The Method for Storing Patterns in Neural Networks-Memorization and Recall of QR code Patterns-	Apr 9, 2025	Language ModelingLanguage Modelling	—Unverified	0
RuOpinionNE-2024: Extraction of Opinion Tuples from Russian News Texts	Apr 9, 2025	Dialogue EvaluationLanguage Modeling	CodeCode Available	0
A Multi-Phase Analysis of Blood Culture Stewardship: Machine Learning Prediction, Expert Recommendation Assessment, and LLM Automation	Apr 9, 2025	DiagnosticLanguage Modeling	—Unverified	0
Language Modeling for the Future of Finance: A Quantitative Survey into Metrics, Tasks, and Data Opportunities	Apr 9, 2025	Language ModelingLanguage Modelling	—Unverified	0
PAYADOR: A Minimalist Approach to Grounding Language Models on Structured Data for Interactive Storytelling and Role-playing Games	Apr 9, 2025	Language ModelingLanguage Modelling	CodeCode Available	0
MovSAM: A Single-image Moving Object Segmentation Framework Based on Deep Thinking	Apr 9, 2025	Autonomous DrivingLanguage Modeling	CodeCode Available	0
Q-Agent: Quality-Driven Chain-of-Thought Image Restoration Agent through Robust Multimodal Large Language Model	Apr 9, 2025	Image Quality AssessmentImage Restoration	—Unverified	0
TASTE: Text-Aligned Speech Tokenization and Embedding for Spoken Language Modeling	Apr 9, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
Societal Impacts Research Requires Benchmarks for Creative Composition Tasks	Apr 9, 2025	Language ModelingLanguage Modelling	—Unverified	0
Skywork R1V: Pioneering Multimodal Reasoning with Chain-of-Thought	Apr 8, 2025	Language ModelingLanguage Modelling	CodeCode Available	7
InstructMPC: A Human-LLM-in-the-Loop Framework for Context-Aware Control	Apr 8, 2025	energy managementLanguage Modeling	—Unverified	0
Simplifying Data Integration: SLM-Driven Systems for Unified Semantic Queries Across Heterogeneous Databases	Apr 8, 2025	Data IntegrationLanguage Modeling	—Unverified	0
DoCIA: An Online Document-Level Context Incorporation Agent for Speech Translation	Apr 7, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Evaluating Knowledge Graph Based Retrieval Augmented Generation Methods under Knowledge Incompleteness	Apr 7, 2025	Knowledge GraphsLanguage Modeling	—Unverified	0

Show:10 25 50

← PrevPage 19 of 353Next →

All datasets WikiText-103 Penn Treebank (Word Level)enwik8 The Pile WikiText-2 LAMBADA One Billion Word Text8 Penn Treebank (Character Level)Hutter Prize OpenWebText SALMon

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Decay RNN	Validation perplexity	76.67	—	Unverified
2	GRU	Validation perplexity	53.78	—	Unverified
3	LSTM	Validation perplexity	52.73	—	Unverified
4	LSTM	Test perplexity	48.7	—	Unverified
5	Temporal CNN	Test perplexity	45.2	—	Unverified
6	TCN	Test perplexity	45.19	—	Unverified
7	GCNN-8	Test perplexity	44.9	—	Unverified
8	Neural cache model (size = 100)	Test perplexity	44.8	—	Unverified
9	Neural cache model (size = 2,000)	Test perplexity	40.8	—	Unverified
10	GPT-2 Small	Test perplexity	37.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TCN	Test perplexity	108.47	—	Unverified
2	Seq-U-Net	Test perplexity	107.95	—	Unverified
3	GRU (Bai et al., 2018)	Test perplexity	92.48	—	Unverified
4	R-Transformer	Test perplexity	84.38	—	Unverified
5	Zaremba et al. (2014) - LSTM (medium)	Test perplexity	82.7	—	Unverified
6	Gal & Ghahramani (2016) - Variational LSTM (medium)	Test perplexity	79.7	—	Unverified
7	LSTM (Bai et al., 2018)	Test perplexity	78.93	—	Unverified
8	Zaremba et al. (2014) - LSTM (large)	Test perplexity	78.4	—	Unverified
9	Gal & Ghahramani (2016) - Variational LSTM (large)	Test perplexity	75.2	—	Unverified
10	Inan et al. (2016) - Variational RHN	Test perplexity	66	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSTM (7 layers)	Bit per Character (BPC)	1.67	—	Unverified
2	Hypernetworks	Bit per Character (BPC)	1.34	—	Unverified
3	SHA-LSTM (4 layers, h=1024, no attention head)	Bit per Character (BPC)	1.33	—	Unverified
4	LN HM-LSTM	Bit per Character (BPC)	1.32	—	Unverified
5	ByteNet	Bit per Character (BPC)	1.31	—	Unverified
6	Recurrent Highway Networks	Bit per Character (BPC)	1.27	—	Unverified
7	Large FS-LSTM-4	Bit per Character (BPC)	1.25	—	Unverified
8	Large mLSTM	Bit per Character (BPC)	1.24	—	Unverified
9	AWD-LSTM (3 layers)	Bit per Character (BPC)	1.23	—	Unverified
10	Cluster-Former (#C=512)	Bit per Character (BPC)	1.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Smaller Transformer 126M (pre-trained)	Test perplexity	33	—	Unverified
2	OPT 125M	Test perplexity	32.26	—	Unverified
3	Larger Transformer 771M (pre-trained)	Test perplexity	28.1	—	Unverified
4	OPT 1.3B	Test perplexity	19.55	—	Unverified
5	GPT-Neo 125M	Test perplexity	17.83	—	Unverified
6	OPT 2.7B	Test perplexity	17.81	—	Unverified
7	Smaller Transformer 126M (fine-tuned)	Test perplexity	12	—	Unverified
8	GPT-Neo 1.3B	Test perplexity	11.46	—	Unverified
9	Transformer 125M	Test perplexity	10.7	—	Unverified
10	GPT-Neo 2.7B	Test perplexity	10.44	—	Unverified