Language Modelling

A language model is a model of natural language. Language models are useful for a variety of tasks, including speech recognition, machine translation, natural language generation (generating more human-like text), optical character recognition, route optimization, handwriting recognition, grammar induction, and information retrieval.

Large language models (LLMs), currently their most advanced form, are predominantly based on transformers trained on larger datasets (frequently using words scraped from the public internet). They have superseded recurrent neural network-based models, which had previously superseded the purely statistical models, such as word n-gram language model.

Source: Wikipedia

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6451–6500 of 17610 papers

Title	Date	Tasks	Status
Automated Story Generation as Question-Answering	Dec 7, 2021	Generative Question AnsweringLanguage Modeling	—Unverified
Domain Adaptation for Code Model-based Unit Test Case Generation	Aug 15, 2023	Domain AdaptationLanguage Modelling	—Unverified
Automated Testing of COBOL to Java Transformation	Apr 14, 2025	Language ModelingLanguage Modelling	—Unverified
Automated Text Mining of Experimental Methodologies from Biomedical Literature	Apr 21, 2024	ArticlesClassification	—Unverified
Automated Theorem Provers Help Improve Large Language Model Reasoning	Aug 7, 2024	Formal LogicLanguage Modeling	—Unverified
Automated User Story Generation with Test Case Specification Using Large Language Model	Apr 2, 2024	Language ModelingLanguage Modelling	—Unverified
Automated Word Prediction in Bangla Language Using Stochastic Language Models	Feb 25, 2016	Language ModelingLanguage Modelling	—Unverified
Automatically Detecting Online Deceptive Patterns in Real-time	Nov 11, 2024	Language ModelingLanguage Modelling	—Unverified
Automatically Generating Rhythmic Verse with Neural Networks	Jul 1, 2017	Language ModelingLanguage Modelling	—Unverified
Automatically Generating Rules of Malicious Software Packages via Large Language Model	Apr 24, 2025	Language ModelingLanguage Modelling	—Unverified
Automatic Argument Quality Assessment -- New Datasets and Methods	Sep 3, 2019	Language ModelingLanguage Modelling	—Unverified
Automatic Argument Quality Assessment - New Datasets and Methods	Nov 1, 2019	Language ModelingLanguage Modelling	—Unverified
Automatic Assessment of Divergent Thinking in Chinese Language with TransDis: A Transformer-Based Language Model Approach	Jun 26, 2023	Language ModelingLanguage Modelling	—Unverified
Automatic Assessment of Oral Reading Accuracy for Reading Diagnostics	Jun 6, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Automatic Assistance for Academic Word Usage	Dec 1, 2020	Language ModelingLanguage Modelling	—Unverified
Automatic Business Process Structure Discovery using Ordered Neurons LSTM: A Preliminary Study	Jan 5, 2020	Language ModelingLanguage Modelling	—Unverified
Pareto Optimal Learning for Estimating Large Language Model Errors	Jun 28, 2023	Information RetrievalLanguage Modeling	—Unverified
Automatic Chord Recognition with Higher-Order Harmonic Language Modelling	Aug 16, 2018	Chord RecognitionLanguage Modelling	—Unverified
Automatic coding of students' writing via Contrastive Representation Learning in the Wasserstein space	Nov 26, 2020	BIG-bench Machine LearningContrastive Learning	—Unverified
Automatic Conditional Generation of Personalized Social Media Short Texts	Jun 15, 2019	Dialogue GenerationLanguage Modeling	—Unverified
Automatic Construction of Discourse Corpora for Dialogue Translation	May 22, 2016	Information RetrievalLanguage Modeling	—Unverified
Automatic Control With Human-Like Reasoning: Exploring Language Model Embodied Air Traffic Agents	Sep 15, 2024	Language ModelingLanguage Modelling	—Unverified
Automatic conversion of colloquial Finnishto standard Finnish	May 1, 2015	Language ModellingMachine Translation	—Unverified
Automatic Correction of Arabic Text: a Cascaded Approach	Oct 1, 2014	Language ModellingTransliteration	—Unverified
Automatic Data Expansion for Customer-care Spoken Language Understanding	Sep 27, 2018	Language ModellingNatural Language Understanding	—Unverified
Automatic Demonstration Selection for LLM-based Tabular Data Classification	Jun 25, 2025	In-Context LearningLanguage Modeling	—Unverified
Automatic Detection of Borrowings in Low-Resource Languages of the Caucasus: Andic branch	Oct 1, 2022	Language ModelingLanguage Modelling	—Unverified
Automatic detection of diseases in Spanish clinical notes combining medical language models and ontologies	Dec 4, 2024	Language ModelingLanguage Modelling	—Unverified
Automatic Dialect Density Estimation for African American English	Apr 3, 2022	Density EstimationLanguage Modeling	—Unverified
Automatic Documentation of ICD Codes with Far-Field Speech Recognition	Apr 30, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Automatic Extraction of Personality from Text: Challenges and Opportunities	Oct 22, 2019	Language ModelingLanguage Modelling	—Unverified
Automatic Extraction of Synonyms for German Particle Verbs from Parallel Data with Distributional Similarity as a Re-Ranking Feature	May 1, 2014	Language ModelingLanguage Modelling	—Unverified
Automatic Feature Learning for Essence: a Case Study on Car Sequencing	Sep 23, 2024	Language ModelingLanguage Modelling	—Unverified
Automatic Generation of Programming Exercises and Code Explanations using Large Language Models	Jun 3, 2022	Language ModelingLanguage Modelling	—Unverified
ReEval: Automatic Hallucination Evaluation for Retrieval-Augmented Large Language Models via Transferable Adversarial Attacks	Oct 19, 2023	HallucinationHallucination Evaluation	—Unverified
Automatic High-quality Verilog Assertion Generation through Subtask-Focused Fine-Tuned LLMs and Iterative Prompting	Nov 23, 2024	Language ModelingLanguage Modelling	—Unverified
Automatic Identification of Arabic Language Varieties and Dialects in Social Media	Aug 1, 2014	Language ModellingMachine Translation	—Unverified
Automatic Identification of Rhetorical Questions	Jul 1, 2015	Document SummarizationLanguage Modelling	—Unverified
Automatic Information Extraction From Employment Tribunal Judgements Using Large Language Models	Mar 19, 2024	Language ModellingLarge Language Model	—Unverified
Automatic Item Generation for Personality Situational Judgment Tests with Large Language Models	Dec 10, 2024	Language ModelingLanguage Modelling	—Unverified
Automatic Knowledge Augmentation for Generative Commonsense Reasoning	Oct 30, 2021	Language ModelingLanguage Modelling	—Unverified
Automatic language identity tagging on word and sentence-level in multilingual text sources: a case-study on Luxembourgish	May 1, 2014	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Automatic Learning of Subword Dependent Model Scales	Oct 18, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Automatic Long Audio Alignment and Confidence Scoring for Conversational Arabic Speech	May 1, 2014	Language Modellingspeech-recognition	—Unverified
Automatic Machine Translation Evaluation using Source Language Inputs and Cross-lingual Language Model	Jul 1, 2020	Language ModelingLanguage Modelling	—Unverified
Automatic Multi-Label Prompting: Simple and Interpretable Few-Shot Classification	Aug 17, 2021	ClassificationFew-Shot Text Classification	—Unverified
Automatic Myanmar Image Captioning using CNN and LSTM-Based Language Model	May 1, 2020	Image CaptioningLanguage Modeling	—Unverified
Automatic Nominalization of Clauses	Oct 1, 2022	Language ModelingLanguage Modelling	—Unverified
Automatic, Personalized, and Flexible Playlist Generation using Reinforcement Learning	Sep 12, 2018	DiversityLanguage Modeling	—Unverified
Automatic Poetry Generation from Prosaic Text	Jul 1, 2020	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 130 of 353Next →

All datasets WikiText-103 Penn Treebank (Word Level)enwik8 The Pile WikiText-2 LAMBADA One Billion Word Text8 Penn Treebank (Character Level)Hutter Prize OpenWebText SALMon

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Decay RNN	Validation perplexity	76.67	—	Unverified
2	GRU	Validation perplexity	53.78	—	Unverified
3	LSTM	Validation perplexity	52.73	—	Unverified
4	LSTM	Test perplexity	48.7	—	Unverified
5	Temporal CNN	Test perplexity	45.2	—	Unverified
6	TCN	Test perplexity	45.19	—	Unverified
7	GCNN-8	Test perplexity	44.9	—	Unverified
8	Neural cache model (size = 100)	Test perplexity	44.8	—	Unverified
9	Neural cache model (size = 2,000)	Test perplexity	40.8	—	Unverified
10	GPT-2 Small	Test perplexity	37.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TCN	Test perplexity	108.47	—	Unverified
2	Seq-U-Net	Test perplexity	107.95	—	Unverified
3	GRU (Bai et al., 2018)	Test perplexity	92.48	—	Unverified
4	R-Transformer	Test perplexity	84.38	—	Unverified
5	Zaremba et al. (2014) - LSTM (medium)	Test perplexity	82.7	—	Unverified
6	Gal & Ghahramani (2016) - Variational LSTM (medium)	Test perplexity	79.7	—	Unverified
7	LSTM (Bai et al., 2018)	Test perplexity	78.93	—	Unverified
8	Zaremba et al. (2014) - LSTM (large)	Test perplexity	78.4	—	Unverified
9	Gal & Ghahramani (2016) - Variational LSTM (large)	Test perplexity	75.2	—	Unverified
10	Inan et al. (2016) - Variational RHN	Test perplexity	66	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSTM (7 layers)	Bit per Character (BPC)	1.67	—	Unverified
2	Hypernetworks	Bit per Character (BPC)	1.34	—	Unverified
3	SHA-LSTM (4 layers, h=1024, no attention head)	Bit per Character (BPC)	1.33	—	Unverified
4	LN HM-LSTM	Bit per Character (BPC)	1.32	—	Unverified
5	ByteNet	Bit per Character (BPC)	1.31	—	Unverified
6	Recurrent Highway Networks	Bit per Character (BPC)	1.27	—	Unverified
7	Large FS-LSTM-4	Bit per Character (BPC)	1.25	—	Unverified
8	Large mLSTM	Bit per Character (BPC)	1.24	—	Unverified
9	AWD-LSTM (3 layers)	Bit per Character (BPC)	1.23	—	Unverified
10	Cluster-Former (#C=512)	Bit per Character (BPC)	1.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Smaller Transformer 126M (pre-trained)	Test perplexity	33	—	Unverified
2	OPT 125M	Test perplexity	32.26	—	Unverified
3	Larger Transformer 771M (pre-trained)	Test perplexity	28.1	—	Unverified
4	OPT 1.3B	Test perplexity	19.55	—	Unverified
5	GPT-Neo 125M	Test perplexity	17.83	—	Unverified
6	OPT 2.7B	Test perplexity	17.81	—	Unverified
7	Smaller Transformer 126M (fine-tuned)	Test perplexity	12	—	Unverified
8	GPT-Neo 1.3B	Test perplexity	11.46	—	Unverified
9	Transformer 125M	Test perplexity	10.7	—	Unverified
10	GPT-Neo 2.7B	Test perplexity	10.44	—	Unverified