Language Modelling

A language model is a model of natural language. Language models are useful for a variety of tasks, including speech recognition, machine translation, natural language generation (generating more human-like text), optical character recognition, route optimization, handwriting recognition, grammar induction, and information retrieval.

Large language models (LLMs), currently their most advanced form, are predominantly based on transformers trained on larger datasets (frequently using words scraped from the public internet). They have superseded recurrent neural network-based models, which had previously superseded the purely statistical models, such as word n-gram language model.

Source: Wikipedia

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9401–9450 of 17610 papers

Title	Date	Tasks	Status
ATTNChecker: Highly-Optimized Fault Tolerant Attention for Large Language Model Training	Oct 15, 2024	Language ModelingLanguage Modelling	—Unverified
Lightweight Large Language Model for Medication Enquiry: Med-Pal	Jul 2, 2024	ChatbotLanguage Modeling	—Unverified
Lightweight Neural App Control	Oct 23, 2024	Decision MakingLanguage Modeling	—Unverified
Lightweight Unsupervised Federated Learning with Pretrained Vision Language Model	Apr 17, 2024	Federated LearningLanguage Modeling	—Unverified
Like a bilingual baby: The advantage of visually grounding a bilingual language model	Oct 11, 2022	Language ModelingLanguage Modelling	—Unverified
Likelihood Variance as Text Importance for Resampling Texts to Map Language Models	May 21, 2025	Language ModelingLanguage Modelling	—Unverified
LiLiuM: eBay's Large Language Models for e-commerce	Jun 17, 2024	Language ModelingLanguage Modelling	—Unverified
LiLM-RDB-SFC: Lightweight Language Model with Relational Database-Guided DRL for Optimized SFC Provisioning	Jul 15, 2025	Deep Reinforcement LearningLanguage Modeling	—Unverified
LiMe: a Latin Corpus of Late Medieval Criminal Sentences	Apr 19, 2024	Language ModelingLanguage Modelling	—Unverified
Limits of Detecting Text Generated by Large-Scale Language Models	Feb 9, 2020	Language ModelingLanguage Modelling	—Unverified
LIMSIILES: Basic English Substitution for Student Answer Assessment at SemEval 2013	Jun 1, 2013	Language ModellingMachine Translation	—Unverified
LIMSI@IWSLT’16: MT Track	Dec 1, 2016	Language ModelingLanguage Modelling	—Unverified
LIMSI @ WMT13	Aug 1, 2013	Language ModellingMachine Translation	—Unverified
LIMSI @ WMT'14 Medical Translation Task	Jun 1, 2014	Language ModellingMachine Translation	—Unverified
LIMSI@WMT'17	Sep 1, 2017	Language ModelingLanguage Modelling	—Unverified
Linear Attention via Orthogonal Memory	Dec 18, 2023	Causal Language ModelingComputational Efficiency	—Unverified
Linearizing Transformer with Key-Value Memory	Mar 23, 2022	Abstractive Text SummarizationLanguage Modeling	—Unverified
Generation of 3D Molecules in Pockets via Language Model	May 17, 2023	3D Molecule GenerationDrug Design	—Unverified
Linguacodus: A Synergistic Framework for Transformative Code Generation in Machine Learning Pipelines	Mar 18, 2024	Code GenerationLanguage Modeling	—Unverified
LinguAlchemy: Fusing Typological and Geographical Elements for Unseen Language Generalization	Jan 11, 2024	intent-classificationIntent Classification	—Unverified
LinguaLinked: A Distributed Large Language Model Inference System for Mobile Devices	Dec 1, 2023	Language ModelingLanguage Modelling	—Unverified
Lingua Manga: A Generic Large Language Model Centric System for Data Curation	Jun 20, 2023	DiversityLanguage Modeling	—Unverified
Linguistically Informed ChatGPT Prompts to Enhance Japanese-Chinese Machine Translation: A Case Study on Attributive Clauses	Mar 27, 2023	Language ModelingLanguage Modelling	—Unverified
Linguistically Inspired Language Model Augmentation for MT	May 1, 2016	Language ModelingLanguage Modelling	—Unverified
Linguistic Analysis Processing Line for Bulgarian	May 1, 2012	Language ModellingLemmatization	—Unverified
Linguistic-Enhanced Transformer with CTC Embedding for Speech Recognition	Oct 25, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Linguistic Entity Masking to Improve Cross-Lingual Representation of Multilingual Language Models for Low-Resource Languages	Jan 10, 2025	Language ModellingSentiment Analysis	—Unverified
Linguistic Knowledge and Transferability of Contextual Representations	Mar 21, 2019	Language ModelingLanguage Modelling	—Unverified
Linguistic Profiling of a Neural Language Model	Oct 5, 2020	Language ModelingLanguage Modelling	—Unverified
Linguistic Regularities in Continuous Space Word Representations	Jun 1, 2013	Language Modelling	—Unverified
Linguistic Structured Sparsity in Text Categorization	Jun 1, 2014	Feature EngineeringLanguage Modelling	—Unverified
LINGUIST: Language Model Instruction Tuning to Generate Annotated Utterances for Intent Classification and Slot Tagging	Sep 20, 2022	intent-classificationIntent Classification	—Unverified
Link Prediction via Graph Attention Network	Oct 10, 2019	Graph AttentionInformation Retrieval	—Unverified
LINKs: Large Language Model Integrated Management for 6G Empowered Digital Twin NetworKs	Dec 9, 2024	Language ModelingLanguage Modelling	—Unverified
[Lions: 1] and [Tigers: 2] and [Bears: 3], Oh My! Literary Coreference Annotation with LLMs	Jan 31, 2024	Language ModelingLanguage Modelling	—Unverified
LipidBERT: A Lipid Language Model Pre-trained on METiS de novo Lipid Library	Aug 12, 2024	Language ModelingLanguage Modelling	—Unverified
Listen, Attend, Spell and Adapt: Speaker Adapted Sequence-to-Sequence ASR	Jul 8, 2019	Language Modelling	—Unverified
Listen, Chat, and Remix: Text-Guided Soundscape Remixing for Enhanced Auditory Experience	Feb 6, 2024	Language ModelingLanguage Modelling	—Unverified
Listen to the Context: Towards Faithful Large Language Models for Retrieval Augmented Generation on Climate Questions	May 21, 2025	Language ModelingLanguage Modelling	—Unverified
LiteVL: Efficient Video-Language Learning with Enhanced Spatial-Temporal Modeling	Oct 21, 2022	Language ModelingLanguage Modelling	—Unverified
LiteVLM: A Low-Latency Vision-Language Model Inference Pipeline for Resource-Constrained Environments	Jun 9, 2025	Autonomous DrivingLanguage Modeling	—Unverified
LIT: Large Language Model Driven Intention Tracking for Proactive Human-Robot Collaboration -- A Robot Sous-Chef Application	Jun 19, 2024	Language ModelingLanguage Modelling	—Unverified
LittleBird: Efficient Faster & Longer Transformer for Question Answering	Oct 21, 2022	Language ModellingQuestion Answering	—Unverified
LIUM's SMT Machine Translation Systems for WMT 2012	Jun 1, 2012	Information RetrievalLanguage Modelling	—Unverified
LiveCC: Learning Video LLM with Streaming Speech Transcription at Scale	Jan 1, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Lizard: An Efficient Linearization Framework for Large Language Models	Jul 11, 2025	Language ModelingLanguage Modelling	—Unverified
LLaDA 1.5: Variance-Reduced Preference Optimization for Large Language Diffusion Models	May 25, 2025	GSM8KHumanEval	—Unverified
LLaDA-V: Large Language Diffusion Models with Visual Instruction Tuning	May 22, 2025	Language ModelingLanguage Modelling	—Unverified
Llama-3.1-Sherkala-8B-Chat: An Open Large Language Model for Kazakh	Mar 3, 2025	Language ModelingLanguage Modelling	—Unverified
LLaMA based Punctuation Restoration With Forward Pass Only Decoding	Aug 9, 2024	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 189 of 353Next →

All datasets WikiText-103 Penn Treebank (Word Level)enwik8 The Pile WikiText-2 LAMBADA One Billion Word Text8 Penn Treebank (Character Level)Hutter Prize OpenWebText SALMon

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Decay RNN	Validation perplexity	76.67	—	Unverified
2	GRU	Validation perplexity	53.78	—	Unverified
3	LSTM	Validation perplexity	52.73	—	Unverified
4	LSTM	Test perplexity	48.7	—	Unverified
5	Temporal CNN	Test perplexity	45.2	—	Unverified
6	TCN	Test perplexity	45.19	—	Unverified
7	GCNN-8	Test perplexity	44.9	—	Unverified
8	Neural cache model (size = 100)	Test perplexity	44.8	—	Unverified
9	Neural cache model (size = 2,000)	Test perplexity	40.8	—	Unverified
10	GPT-2 Small	Test perplexity	37.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TCN	Test perplexity	108.47	—	Unverified
2	Seq-U-Net	Test perplexity	107.95	—	Unverified
3	GRU (Bai et al., 2018)	Test perplexity	92.48	—	Unverified
4	R-Transformer	Test perplexity	84.38	—	Unverified
5	Zaremba et al. (2014) - LSTM (medium)	Test perplexity	82.7	—	Unverified
6	Gal & Ghahramani (2016) - Variational LSTM (medium)	Test perplexity	79.7	—	Unverified
7	LSTM (Bai et al., 2018)	Test perplexity	78.93	—	Unverified
8	Zaremba et al. (2014) - LSTM (large)	Test perplexity	78.4	—	Unverified
9	Gal & Ghahramani (2016) - Variational LSTM (large)	Test perplexity	75.2	—	Unverified
10	Inan et al. (2016) - Variational RHN	Test perplexity	66	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSTM (7 layers)	Bit per Character (BPC)	1.67	—	Unverified
2	Hypernetworks	Bit per Character (BPC)	1.34	—	Unverified
3	SHA-LSTM (4 layers, h=1024, no attention head)	Bit per Character (BPC)	1.33	—	Unverified
4	LN HM-LSTM	Bit per Character (BPC)	1.32	—	Unverified
5	ByteNet	Bit per Character (BPC)	1.31	—	Unverified
6	Recurrent Highway Networks	Bit per Character (BPC)	1.27	—	Unverified
7	Large FS-LSTM-4	Bit per Character (BPC)	1.25	—	Unverified
8	Large mLSTM	Bit per Character (BPC)	1.24	—	Unverified
9	AWD-LSTM (3 layers)	Bit per Character (BPC)	1.23	—	Unverified
10	Cluster-Former (#C=512)	Bit per Character (BPC)	1.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Smaller Transformer 126M (pre-trained)	Test perplexity	33	—	Unverified
2	OPT 125M	Test perplexity	32.26	—	Unverified
3	Larger Transformer 771M (pre-trained)	Test perplexity	28.1	—	Unverified
4	OPT 1.3B	Test perplexity	19.55	—	Unverified
5	GPT-Neo 125M	Test perplexity	17.83	—	Unverified
6	OPT 2.7B	Test perplexity	17.81	—	Unverified
7	Smaller Transformer 126M (fine-tuned)	Test perplexity	12	—	Unverified
8	GPT-Neo 1.3B	Test perplexity	11.46	—	Unverified
9	Transformer 125M	Test perplexity	10.7	—	Unverified
10	GPT-Neo 2.7B	Test perplexity	10.44	—	Unverified