Language Modelling

A language model is a model of natural language. Language models are useful for a variety of tasks, including speech recognition, machine translation, natural language generation (generating more human-like text), optical character recognition, route optimization, handwriting recognition, grammar induction, and information retrieval.

Large language models (LLMs), currently their most advanced form, are predominantly based on transformers trained on larger datasets (frequently using words scraped from the public internet). They have superseded recurrent neural network-based models, which had previously superseded the purely statistical models, such as word n-gram language model.

Source: Wikipedia

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10201–10250 of 17610 papers

Title	Date	Tasks	Status
PersonaFlow: Boosting Research Ideation with LLM-Simulated Expert Personas	Sep 19, 2024	Language ModelingLanguage Modelling	—Unverified
Personal Intelligence System UniLM: Hybrid On-Device Small Language Model and Server-Based Large Language Model for Malay Nusantara	Oct 9, 2024	Language ModelingLanguage Modelling	—Unverified
Personality Structured Interview for Large Language Model Simulation in Personality Research	Feb 17, 2025	Language ModelingLanguage Modelling	—Unverified
Personality Trait Detection Using Bagged SVM over BERT Word Embedding Ensembles	Oct 3, 2020	Language ModelingLanguage Modelling	—Unverified
Preference Adaptive and Sequential Text-to-Image Generation	Dec 10, 2024	Image GenerationLanguage Modeling	—Unverified
Personalized Federated Fine-tuning for Heterogeneous Data: An Automatic Rank Learning Approach via Two-Level LoRA	Mar 5, 2025	Language ModelingLanguage Modelling	—Unverified
Personalized neural language models for real-world query auto completion	Apr 17, 2018	DiversityLanguage Modeling	—Unverified
Personalized Response Generation with Tensor Factorization	Aug 1, 2021	DecoderLanguage Modeling	—Unverified
Personalized Risks and Regulatory Strategies of Large Language Models in Digital Advertising	May 7, 2025	feature selectionLanguage Modeling	—Unverified
Personalized Speech recognition on mobile devices	Mar 10, 2016	DecoderLanguage Modeling	—Unverified
Personalizing Universal Recurrent Neural Network Language Model with User Characteristic Features by Social Network Crowdsouring	Jun 3, 2015	Language ModelingLanguage Modelling	—Unverified
'Person' == Light-skinned, Western Man, and Sexualization of Women of Color: Stereotypes in Stable Diffusion	Oct 30, 2023	Language Modelling	—Unverified
Person Re-Identification with Vision and Language	Oct 3, 2017	Language ModelingLanguage Modelling	—Unverified
PETapter: Leveraging PET-style classification heads for modular few-shot parameter-efficient fine-tuning	Dec 6, 2024	Few-Shot LearningLanguage Modeling	—Unverified
PEVA-Net: Prompt-Enhanced View Aggregation Network for Zero/Few-Shot Multi-View 3D Shape Recognition	Apr 30, 2024	3D Shape RecognitionFew-Shot Learning	—Unverified
PeVL: Pose-Enhanced Vision-Language Model for Fine-Grained Human Action Recognition	Jan 1, 2024	Action RecognitionContrastive Learning	—Unverified
PFPs: Prompt-guided Flexible Pathological Segmentation for Diverse Potential Outcomes Using Large Vision and Language Models	Jul 13, 2024	Language ModelingLanguage Modelling	—Unverified
PGPO: Enhancing Agent Reasoning via Pseudocode-style Planning Guided Preference Optimization	Jun 2, 2025	Language ModelingLanguage Modelling	—Unverified
PharmAgents: Building a Virtual Pharma with Large Language Model Agents	Mar 28, 2025	Drug DiscoveryLanguage Modeling	—Unverified
PharmaGPT: Domain-Specific Large Language Models for Bio-Pharmaceutical and Chemistry	Jun 26, 2024	Feature EngineeringLanguage Modeling	—Unverified
PHEONA: An Evaluation Framework for Large Language Model-based Approaches to Computational Phenotyping	Mar 25, 2025	Computational PhenotypingLanguage Modeling	—Unverified
Phi-3 Safety Post-Training: Aligning Language Models with a "Break-Fix" Cycle	Jul 18, 2024	BenchmarkingLanguage Modeling	—Unverified
Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone	Apr 22, 2024	Language ModelingLanguage Modelling	—Unverified
PhilHumans: Benchmarking Machine Learning for Personal Health	May 4, 2024	Action AnticipationBenchmarking	—Unverified
Philippine Language Resources: Applications, Issues, and Directions	Oct 1, 2016	Language ModelingLanguage Modelling	—Unverified
Phi-Omni-ST: A multimodal language model for direct speech-to-speech translation	Jun 4, 2025	Language ModelingLanguage Modelling	—Unverified
PHMOSpell: Phonological and Morphological Knowledge Guided Chinese Spelling Check	Aug 1, 2021	Chinese Spell CheckingLanguage Modeling	—Unverified
Phone-ing it in: Towards Flexible Multi-Modal Language Model Training by Phonetic Representations of Data	Nov 16, 2021	Language ModelingLanguage Modelling	—Unverified
Phoneme Based Neural Transducer for Large Vocabulary Speech Recognition	Oct 30, 2020	Language ModelingLanguage Modelling	—Unverified
Phoneme Level Language Models for Sequence Based Low Resource ASR	Feb 20, 2019	Language ModelingLanguage Modelling	—Unverified
Phoneme Set Design Using English Speech Database by Japanese for Dialogue-Based English CALL Systems	May 1, 2014	Language ModellingSpeech Recognition	—Unverified
Phoneme Similarity Matrices to Improve Long Audio Alignment for Automatic Subtitling	May 1, 2014	DecoderLanguage Modelling	—Unverified
Phonetic Enhanced Language Modeling for Text-to-Speech Synthesis	Jun 4, 2024	In-Context LearningLanguage Modeling	—Unverified
Phonetic Normalization for Machine Translation of User Generated Content	Nov 1, 2019	Language ModelingLanguage Modelling	—Unverified
PhonologyBench: Evaluating Phonological Skills of Large Language Models	Apr 3, 2024	DiagnosticGrapheme-to-Phoneme Conversion	—Unverified
Phonotactic Modeling of Extremely Low Resource Languages	Dec 1, 2016	Language ModelingLanguage Modelling	—Unverified
PhotoArtAgent: Intelligent Photo Retouching with Language Model-Based Artist Agents	May 29, 2025	Language ModelingLanguage Modelling	—Unverified
PhotoBot: Reference-Guided Interactive Photography via Natural Language	Jan 19, 2024	Language ModelingLanguage Modelling	—Unverified
Phrasal: A Toolkit for New Directions in Statistical Machine Translation	Jun 1, 2014	Language ModellingMachine Translation	—Unverified
Phrase2VecGLM: Neural generalized language model--based semantic tagging for complex query reformulation in medical IR	Jul 1, 2018	Document RankingInformation Retrieval	—Unverified
Phrase-aware Unsupervised Constituency Parsing	Nov 16, 2021	Constituency ParsingLanguage Modeling	—Unverified
Phrase-aware Unsupervised Constituency Parsing	May 1, 2022	Constituency ParsingLanguage Modeling	—Unverified
Phrase-based Image Captioning	Feb 12, 2015	DescriptiveImage Captioning	—Unverified
Phrase Based Language Model for Statistical Machine Translation: Empirical Study	Jan 21, 2015	Language ModelingLanguage Modelling	—Unverified
Phrase Based Language Model For Statistical Machine Translation	Jan 18, 2015	Language ModelingLanguage Modelling	—Unverified
Phrase-Based SMT for Finnish with More Data, Better Models and Alternative Alignment and Translation Tools	Aug 1, 2016	Language ModelingLanguage Modelling	—Unverified
PHRASED: Phrase Dictionary Biasing for Speech Translation	Jun 10, 2025	Language ModelingLanguage Modelling	—Unverified
Phraselette: A Poet's Procedural Palette	Mar 8, 2025	Language ModelingLanguage Modelling	—Unverified
Phrase-Level Class based Language Model for Mandarin Smart Speaker Query Recognition	Sep 2, 2019	Language ModelingLanguage Modelling	—Unverified
PhyloGen: Language Model-Enhanced Phylogenetic Inference via Graph Structure Generation	Dec 25, 2024	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 205 of 353Next →

All datasets WikiText-103 Penn Treebank (Word Level)enwik8 The Pile WikiText-2 LAMBADA One Billion Word Text8 Penn Treebank (Character Level)Hutter Prize OpenWebText SALMon

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Decay RNN	Validation perplexity	76.67	—	Unverified
2	GRU	Validation perplexity	53.78	—	Unverified
3	LSTM	Validation perplexity	52.73	—	Unverified
4	LSTM	Test perplexity	48.7	—	Unverified
5	Temporal CNN	Test perplexity	45.2	—	Unverified
6	TCN	Test perplexity	45.19	—	Unverified
7	GCNN-8	Test perplexity	44.9	—	Unverified
8	Neural cache model (size = 100)	Test perplexity	44.8	—	Unverified
9	Neural cache model (size = 2,000)	Test perplexity	40.8	—	Unverified
10	GPT-2 Small	Test perplexity	37.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TCN	Test perplexity	108.47	—	Unverified
2	Seq-U-Net	Test perplexity	107.95	—	Unverified
3	GRU (Bai et al., 2018)	Test perplexity	92.48	—	Unverified
4	R-Transformer	Test perplexity	84.38	—	Unverified
5	Zaremba et al. (2014) - LSTM (medium)	Test perplexity	82.7	—	Unverified
6	Gal & Ghahramani (2016) - Variational LSTM (medium)	Test perplexity	79.7	—	Unverified
7	LSTM (Bai et al., 2018)	Test perplexity	78.93	—	Unverified
8	Zaremba et al. (2014) - LSTM (large)	Test perplexity	78.4	—	Unverified
9	Gal & Ghahramani (2016) - Variational LSTM (large)	Test perplexity	75.2	—	Unverified
10	Inan et al. (2016) - Variational RHN	Test perplexity	66	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSTM (7 layers)	Bit per Character (BPC)	1.67	—	Unverified
2	Hypernetworks	Bit per Character (BPC)	1.34	—	Unverified
3	SHA-LSTM (4 layers, h=1024, no attention head)	Bit per Character (BPC)	1.33	—	Unverified
4	LN HM-LSTM	Bit per Character (BPC)	1.32	—	Unverified
5	ByteNet	Bit per Character (BPC)	1.31	—	Unverified
6	Recurrent Highway Networks	Bit per Character (BPC)	1.27	—	Unverified
7	Large FS-LSTM-4	Bit per Character (BPC)	1.25	—	Unverified
8	Large mLSTM	Bit per Character (BPC)	1.24	—	Unverified
9	AWD-LSTM (3 layers)	Bit per Character (BPC)	1.23	—	Unverified
10	Cluster-Former (#C=512)	Bit per Character (BPC)	1.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Smaller Transformer 126M (pre-trained)	Test perplexity	33	—	Unverified
2	OPT 125M	Test perplexity	32.26	—	Unverified
3	Larger Transformer 771M (pre-trained)	Test perplexity	28.1	—	Unverified
4	OPT 1.3B	Test perplexity	19.55	—	Unverified
5	GPT-Neo 125M	Test perplexity	17.83	—	Unverified
6	OPT 2.7B	Test perplexity	17.81	—	Unverified
7	Smaller Transformer 126M (fine-tuned)	Test perplexity	12	—	Unverified
8	GPT-Neo 1.3B	Test perplexity	11.46	—	Unverified
9	Transformer 125M	Test perplexity	10.7	—	Unverified
10	GPT-Neo 2.7B	Test perplexity	10.44	—	Unverified