Language Modelling

A language model is a model of natural language. Language models are useful for a variety of tasks, including speech recognition, machine translation, natural language generation (generating more human-like text), optical character recognition, route optimization, handwriting recognition, grammar induction, and information retrieval.

Large language models (LLMs), currently their most advanced form, are predominantly based on transformers trained on larger datasets (frequently using words scraped from the public internet). They have superseded recurrent neural network-based models, which had previously superseded the purely statistical models, such as word n-gram language model.

Source: Wikipedia

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5001–5050 of 17610 papers

Title	Date	Tasks	Status	Score
Distinguishability Calibration to In-Context Learning	Feb 13, 2023	In-Context LearningLanguage Modelling	CodeCode Available	5
How about Time? Probing a Multilingual Language Model for Temporal Relations	Oct 1, 2022	Language ModelingLanguage Modelling	CodeCode Available	5
Distinguishing Non-natural from Natural Adversarial Samples for More Robust Pre-trained Language Model	Mar 19, 2022	Data AugmentationLanguage Modeling	CodeCode Available	5
How Decoding Strategies Affect the Verifiability of Generated Text	Nov 9, 2019	Language ModellingNatural Language Understanding	CodeCode Available	5
Alibaba-Translate China's Submission for WMT 2022 Metrics Shared Task	Oct 18, 2022	Language ModelingLanguage Modelling	CodeCode Available	5
Alibaba-Translate China's Submission for WMT 2022 Quality Estimation Shared Task	Oct 18, 2022	Language ModelingLanguage Modelling	CodeCode Available	5
A Lightweight Constrained Generation Alternative for Query-focused Summarization	Apr 23, 2023	Language ModelingLanguage Modelling	CodeCode Available	5
How does the task complexity of masked pretraining objectives affect downstream performance?	May 18, 2023	Language ModelingLanguage Modelling	CodeCode Available	5
Distributional Discrepancy: A Metric for Unconditional Text Generation	May 4, 2020	DiversityLanguage Modeling	CodeCode Available	5
Distributionally Robust Language Modeling	Sep 4, 2019	Language ModelingLanguage Modelling	CodeCode Available	5
How Far Are LLMs from Believable AI? A Benchmark for Evaluating the Believability of Human Behavior Simulation	Dec 28, 2023	AI AgentLanguage Modelling	CodeCode Available	5
Distributionally robust self-supervised learning for tabular data	Oct 11, 2024	DecoderLanguage Modeling	CodeCode Available	5
Align^2LLaVA: Cascaded Human and Large Language Model Preference Alignment for Multi-modal Instruction Curation	Sep 27, 2024	Instruction FollowingLanguage Modeling	CodeCode Available	5
A Semi-Supervised Approach for Low-Resourced Text Generation	Jun 3, 2019	DecoderDenoising	CodeCode Available	5
Adversarial Dropout for Recurrent Neural Networks	Apr 22, 2019	Language ModelingLanguage Modelling	CodeCode Available	5
How Long Is Enough? Exploring the Optimal Intervals of Long-Range Clinical Note Language Modeling	Oct 25, 2022	Language ModelingLanguage Modelling	CodeCode Available	5
How much complexity does an RNN architecture need to learn syntax-sensitive dependencies?	May 17, 2020	Language ModelingLanguage Modelling	CodeCode Available	5
How Personality Traits Influence Negotiation Outcomes? A Simulation based on Large Language Models	Jul 16, 2024	Decision MakingLanguage Modeling	CodeCode Available	5
How Phonotactics Affect Multilingual and Zero-shot ASR Performance	Oct 22, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
How Predictable Are Large Language Model Capabilities? A Case Study on BIG-bench	May 24, 2023	DiversityLanguage Modeling	CodeCode Available	5
Aligned Music Notation and Lyrics Transcription	Dec 5, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
How Robust Are Router-LLMs? Analysis of the Fragility of LLM Routing Capabilities	Mar 20, 2025	General KnowledgeLanguage Modeling	CodeCode Available	5
ChatVis: Automating Scientific Visualization with a Large Language Model	Oct 7, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
Diversity Measures: Domain-Independent Proxies for Failure in Language Model Queries	Aug 22, 2023	DiversityLanguage Modeling	CodeCode Available	5
Diversity-Promoting GAN: A Cross-Entropy Based Generative Adversarial Network for Diversified Text Generation	Oct 1, 2018	Dialogue GenerationDiversity	CodeCode Available	5
How to Determine the Most Powerful Pre-trained Language Model without Brute Force Fine-tuning? An Empirical Survey	Dec 8, 2023	Language ModelingLanguage Modelling	CodeCode Available	5
How to Determine the Preferred Image Distribution of a Black-Box Vision-Language Model?	Sep 3, 2024	In-Context LearningLanguage Modeling	CodeCode Available	5
How To Evaluate Your Dialogue System: Probe Tasks as an Alternative for Token-level Evaluation Metrics	Aug 24, 2020	Language ModelingLanguage Modelling	CodeCode Available	5
How to Leverage Demonstration Data in Alignment for Large Language Model? A Self-Imitation Learning Perspective	Oct 14, 2024	Density Ratio EstimationGSM8K	CodeCode Available	5
How to Leverage Personal Textual Knowledge for Personalized Conversational Information Retrieval	Jul 23, 2024	Information RetrievalLanguage Modeling	CodeCode Available	5
How to Protect Copyright Data in Optimization of Large Language Models?	Aug 23, 2023	Language ModelingLanguage Modelling	CodeCode Available	5
Adversarially Regularising Neural NLI Models to Integrate Logical Background Knowledge	Aug 26, 2018	BIG-bench Machine LearningLanguage Modeling	CodeCode Available	5
Alibaba LingmaAgent: Improving Automated Issue Resolution via Comprehensive Repository Exploration	Jun 3, 2024	Language ModellingLarge Language Model	CodeCode Available	5
How to Unleash the Power of Large Language Models for Few-shot Relation Extraction?	May 2, 2023	In-Context LearningLanguage Modeling	CodeCode Available	5
How transformers learn structured data: insights from hierarchical filtering	Aug 27, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
Cheetah: Natural Language Generation for 517 African Languages	Jan 2, 2024	DiversityLanguage Modeling	CodeCode Available	5
A Cross Attention Approach to Diagnostic Explainability using Clinical Practice Guidelines for Depression	Nov 23, 2023	Clinical KnowledgeDiagnostic	CodeCode Available	5
Chemical Language Model Linker: blending text and molecules with modular adapters	Oct 26, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
How would Stance Detection Techniques Evolve after the Launch of ChatGPT?	Dec 30, 2022	Language ModellingStance Detection	CodeCode Available	5
HRKD: Hierarchical Relational Knowledge Distillation for Cross-domain Language Model Compression	Oct 16, 2021	Few-Shot LearningKnowledge Distillation	CodeCode Available	5
DNAHLM -- DNA sequence and Human Language mixed large language Model	Oct 22, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
DNA Language Model and Interpretable Graph Neural Network Identify Genes and Pathways Involved in Rare Diseases	Oct 20, 2024	Graph Neural NetworkLanguage Modeling	CodeCode Available	5
DNAZEN: Enhanced Gene Sequence Representations via Mixed Granularities of Coding Units	May 4, 2025	Language ModelingLanguage Modelling	CodeCode Available	5
DnDScore: Decontextualization and Decomposition for Factuality Verification in Long-Form Text Generation	Dec 17, 2024	FormLanguage Modeling	CodeCode Available	5
Decomposed Prompting to Answer Questions on a Course Discussion Board	Jul 30, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
HUBERT Untangles BERT to Improve Transfer across NLP Tasks	Oct 25, 2019	Language ModelingLanguage Modelling	CodeCode Available	5
HuBo-VLM: Unified Vision-Language Model designed for HUman roBOt interaction tasks	Aug 24, 2023	Language ModelingLanguage Modelling	CodeCode Available	5
hULMonA: The Universal Language Model in Arabic	Aug 1, 2019	Arabic Sentiment AnalysisGeneral Classification	CodeCode Available	5
Human-Centered LLM-Agent User Interface: A Position Paper	May 19, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
Humane Speech Synthesis through Zero-Shot Emotion and Disfluency Generation	Mar 31, 2024	Language ModelingLanguage Modelling	CodeCode Available	5

Show:10 25 50

← PrevPage 101 of 353Next →

All datasets WikiText-103 Penn Treebank (Word Level)enwik8 The Pile WikiText-2 LAMBADA One Billion Word Text8 Penn Treebank (Character Level)Hutter Prize OpenWebText SALMon

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Decay RNN	Validation perplexity	76.67	—	Unverified
2	GRU	Validation perplexity	53.78	—	Unverified
3	LSTM	Validation perplexity	52.73	—	Unverified
4	LSTM	Test perplexity	48.7	—	Unverified
5	Temporal CNN	Test perplexity	45.2	—	Unverified
6	TCN	Test perplexity	45.19	—	Unverified
7	GCNN-8	Test perplexity	44.9	—	Unverified
8	Neural cache model (size = 100)	Test perplexity	44.8	—	Unverified
9	Neural cache model (size = 2,000)	Test perplexity	40.8	—	Unverified
10	GPT-2 Small	Test perplexity	37.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TCN	Test perplexity	108.47	—	Unverified
2	Seq-U-Net	Test perplexity	107.95	—	Unverified
3	GRU (Bai et al., 2018)	Test perplexity	92.48	—	Unverified
4	R-Transformer	Test perplexity	84.38	—	Unverified
5	Zaremba et al. (2014) - LSTM (medium)	Test perplexity	82.7	—	Unverified
6	Gal & Ghahramani (2016) - Variational LSTM (medium)	Test perplexity	79.7	—	Unverified
7	LSTM (Bai et al., 2018)	Test perplexity	78.93	—	Unverified
8	Zaremba et al. (2014) - LSTM (large)	Test perplexity	78.4	—	Unverified
9	Gal & Ghahramani (2016) - Variational LSTM (large)	Test perplexity	75.2	—	Unverified
10	Inan et al. (2016) - Variational RHN	Test perplexity	66	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSTM (7 layers)	Bit per Character (BPC)	1.67	—	Unverified
2	Hypernetworks	Bit per Character (BPC)	1.34	—	Unverified
3	SHA-LSTM (4 layers, h=1024, no attention head)	Bit per Character (BPC)	1.33	—	Unverified
4	LN HM-LSTM	Bit per Character (BPC)	1.32	—	Unverified
5	ByteNet	Bit per Character (BPC)	1.31	—	Unverified
6	Recurrent Highway Networks	Bit per Character (BPC)	1.27	—	Unverified
7	Large FS-LSTM-4	Bit per Character (BPC)	1.25	—	Unverified
8	Large mLSTM	Bit per Character (BPC)	1.24	—	Unverified
9	AWD-LSTM (3 layers)	Bit per Character (BPC)	1.23	—	Unverified
10	Cluster-Former (#C=512)	Bit per Character (BPC)	1.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Smaller Transformer 126M (pre-trained)	Test perplexity	33	—	Unverified
2	OPT 125M	Test perplexity	32.26	—	Unverified
3	Larger Transformer 771M (pre-trained)	Test perplexity	28.1	—	Unverified
4	OPT 1.3B	Test perplexity	19.55	—	Unverified
5	GPT-Neo 125M	Test perplexity	17.83	—	Unverified
6	OPT 2.7B	Test perplexity	17.81	—	Unverified
7	Smaller Transformer 126M (fine-tuned)	Test perplexity	12	—	Unverified
8	GPT-Neo 1.3B	Test perplexity	11.46	—	Unverified
9	Transformer 125M	Test perplexity	10.7	—	Unverified
10	GPT-Neo 2.7B	Test perplexity	10.44	—	Unverified