Language Modelling

A language model is a model of natural language. Language models are useful for a variety of tasks, including speech recognition, machine translation, natural language generation (generating more human-like text), optical character recognition, route optimization, handwriting recognition, grammar induction, and information retrieval.

Large language models (LLMs), currently their most advanced form, are predominantly based on transformers trained on larger datasets (frequently using words scraped from the public internet). They have superseded recurrent neural network-based models, which had previously superseded the purely statistical models, such as word n-gram language model.

Source: Wikipedia

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5601–5650 of 17610 papers

Title	Date	Tasks	Status
Advancing Momentum Pseudo-Labeling with Conformer and Initialization Strategy	Oct 11, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Advancing RNN Transducer Technology for Speech Recognition	Mar 17, 2021	Language ModelingLanguage Modelling	—Unverified
Advancing Single and Multi-task Text Classification through Large Language Model Fine-tuning	Dec 11, 2024	ClassificationDecoder	—Unverified
Advantage Alignment Algorithms	Jun 20, 2024	Autonomous VehiclesDecision Making	—Unverified
Adverbs, Surprisingly	May 31, 2023	Language ModelingLanguage Modelling	—Unverified
Adversarial and Domain-Aware BERT for Cross-Domain Sentiment Analysis	Jul 1, 2020	Domain AdaptationLanguage Modeling	—Unverified
Adversarial Contrastive Pre-training for Protein Sequences	Jan 31, 2021	Language ModelingLanguage Modelling	—Unverified
Adversarial Examples for DNA Classification	Sep 29, 2024	ClassificationLanguage Modeling	—Unverified
Robustness to Modification with Shared Words in Paraphrase Identification	Sep 5, 2019	Language ModelingLanguage Modelling	—Unverified
Adversarial Generation of Natural Language	May 31, 2017	Image GenerationLanguage Modeling	—Unverified
Adversarial Negotiation Dynamics in Generative Language Models	Dec 29, 2024	Language ModelingLanguage Modelling	—Unverified
Adversarial Representation Learning for Text-to-Image Matching	Aug 28, 2019	Image CaptioningLanguage Modeling	—Unverified
Adversarial Soft Prompt Tuning for Cross-Domain Sentiment Analysis	May 1, 2022	Domain AdaptationLanguage Modeling	—Unverified
Adversarial Text Purification: A Large Language Model Approach for Defense	Feb 5, 2024	Adversarial PurificationAdversarial Text	—Unverified
Adversarial Training of End-to-end Speech Recognition Using a Criticizing Language Model	Nov 2, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Adversarial Training of Word2Vec for Basket Completion	May 22, 2018	Language ModelingLanguage Modelling	—Unverified
Adversarial Training with Contrastive Learning in NLP	Sep 19, 2021	Contrastive LearningLanguage Modeling	—Unverified
Adversarial Transfer Learning for Punctuation Restoration	Apr 1, 2020	Language ModelingLanguage Modelling	—Unverified
Adversarial Transformer Language Models for Contextual Commonsense Inference	Feb 10, 2023	Knowledge GraphsLanguage Modeling	—Unverified
Adversities are all you need: Classification of self-reported breast cancer posts on Twitter using Adversarial Fine-tuning	Jun 1, 2021	AllLanguage Modeling	—Unverified
Is your benchmark truly adversarial? AdvScore: Evaluating Human-Grounded Adversarialness	Jun 24, 2024	Language ModelingLanguage Modelling	—Unverified
A Dynamic Programming Algorithm for Computing N-gram Posteriors from Lattices	Sep 1, 2015	Language ModellingMachine Translation	—Unverified
以語言模型評估學習者文句修改前後之流暢度(Using language model to assess the fluency of learners sentences edited by teachers)[In Chinese]	Oct 1, 2016	Language ModelingLanguage Modelling	—Unverified
Aerial Vision-and-Language Navigation via Semantic-Topo-Metric Representation Guided LLM Reasoning	Oct 11, 2024	Language ModelingLanguage Modelling	—Unverified
A Factorized Recurrent Neural Network based architecture for medium to large vocabulary Language Modelling	Feb 4, 2016	Language Modelling	—Unverified
A Fairness-Driven Method for Learning Human-Compatible Negotiation Strategies	Sep 26, 2024	FairnessLanguage Modeling	—Unverified
A Fast, Performant, Secure Distributed Training Framework For Large Language Model	Jan 18, 2024	Language ModelingLanguage Modelling	—Unverified
A federated large language model for long-term time series forecasting	Jul 30, 2024	Language ModelingLanguage Modelling	—Unverified
Affect-LM: A Neural Language Model for Customizable Affective Text Generation	Apr 22, 2017	Language ModelingLanguage Modelling	—Unverified
AffectON: Incorporating Affect Into Dialog Generation	Dec 12, 2020	Language ModelingLanguage Modelling	—Unverified
Affordance Perception by a Knowledge-Guided Vision-Language Model with Efficient Error Correction	Jul 18, 2024	Autonomous NavigationLanguage Modeling	—Unverified
A Financial Service Chatbot based on Deep Bidirectional Transformers	Feb 17, 2020	Chatbotintent-classification	—Unverified
A Fine-Grained Analysis of BERTScore	Nov 1, 2021	Language ModelingLanguage Modelling	—Unverified
A Finite-State Approach to Phrase-Based Statistical Machine Translation	Jul 1, 2012	Language ModellingMachine Translation	—Unverified
A First South African Corpus of Multilingual Code-switched Soap Opera Speech	May 1, 2018	Language Modelling	—Unverified
A Flexible Approach to Automated RNN Architecture Generation	Dec 20, 2017	Language ModelingLanguage Modelling	—Unverified
α-Flow: A Unified Framework for Continuous-State Discrete Flow Matching Models	Apr 14, 2025	Language ModelingLanguage Modelling	—Unverified
A Foundational Multimodal Vision Language AI Assistant for Human Pathology	Dec 13, 2023	Decision MakingDiagnostic	—Unverified
A Fourth Wave of Open Data? Exploring the Spectrum of Scenarios for Open Data and Generative AI	May 7, 2024	Data AugmentationLanguage Modelling	—Unverified
A Framework and Dataset for Abstract Art Generation via CalligraphyGAN	Dec 2, 2020	Image CaptioningImage Generation	—Unverified
A framework for anomaly detection using language modeling, and its applications to finance	Aug 24, 2019	Anomaly DetectionLanguage Modeling	—Unverified
A Framework for Collaborating a Large Language Model Tool in Brainstorming for Triggering Creative Thoughts	Oct 10, 2024	Language ModelingLanguage Modelling	—Unverified
A Framework for Decoding Event-Related Potentials from Text	Feb 27, 2019	Language ModelingLanguage Modelling	—Unverified
A Taxonomy of Foundation Model based Systems through the Lens of Software Architecture	May 9, 2023	Language ModelingLanguage Modelling	—Unverified
A Framework for Evaluating LLMs Under Task Indeterminacy	Nov 21, 2024	Language ModelingLanguage Modelling	—Unverified
A Framework for Evaluating Vision-Language Model Safety: Building Trust in AI for Public Sector Applications	Feb 22, 2025	Language ModelingLanguage Modelling	—Unverified
A Framework for Real-time Safeguarding the Text Generation of Large Language Model	Apr 29, 2024	Language ModelingLanguage Modelling	—Unverified
The Responsible Development of Automated Student Feedback with Generative AI	Aug 29, 2023	Language Modelling	—Unverified
A Framework to Assess the Persuasion Risks Large Language Model Chatbots Pose to Democratic Societies	Apr 29, 2025	Language ModelingLanguage Modelling	—Unverified
AfriKI: Machine-in-the-Loop Afrikaans Poetry Generation	Mar 30, 2021	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 113 of 353Next →

All datasets WikiText-103 Penn Treebank (Word Level)enwik8 The Pile WikiText-2 LAMBADA One Billion Word Text8 Penn Treebank (Character Level)Hutter Prize OpenWebText SALMon

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Decay RNN	Validation perplexity	76.67	—	Unverified
2	GRU	Validation perplexity	53.78	—	Unverified
3	LSTM	Validation perplexity	52.73	—	Unverified
4	LSTM	Test perplexity	48.7	—	Unverified
5	Temporal CNN	Test perplexity	45.2	—	Unverified
6	TCN	Test perplexity	45.19	—	Unverified
7	GCNN-8	Test perplexity	44.9	—	Unverified
8	Neural cache model (size = 100)	Test perplexity	44.8	—	Unverified
9	Neural cache model (size = 2,000)	Test perplexity	40.8	—	Unverified
10	GPT-2 Small	Test perplexity	37.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TCN	Test perplexity	108.47	—	Unverified
2	Seq-U-Net	Test perplexity	107.95	—	Unverified
3	GRU (Bai et al., 2018)	Test perplexity	92.48	—	Unverified
4	R-Transformer	Test perplexity	84.38	—	Unverified
5	Zaremba et al. (2014) - LSTM (medium)	Test perplexity	82.7	—	Unverified
6	Gal & Ghahramani (2016) - Variational LSTM (medium)	Test perplexity	79.7	—	Unverified
7	LSTM (Bai et al., 2018)	Test perplexity	78.93	—	Unverified
8	Zaremba et al. (2014) - LSTM (large)	Test perplexity	78.4	—	Unverified
9	Gal & Ghahramani (2016) - Variational LSTM (large)	Test perplexity	75.2	—	Unverified
10	Inan et al. (2016) - Variational RHN	Test perplexity	66	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSTM (7 layers)	Bit per Character (BPC)	1.67	—	Unverified
2	Hypernetworks	Bit per Character (BPC)	1.34	—	Unverified
3	SHA-LSTM (4 layers, h=1024, no attention head)	Bit per Character (BPC)	1.33	—	Unverified
4	LN HM-LSTM	Bit per Character (BPC)	1.32	—	Unverified
5	ByteNet	Bit per Character (BPC)	1.31	—	Unverified
6	Recurrent Highway Networks	Bit per Character (BPC)	1.27	—	Unverified
7	Large FS-LSTM-4	Bit per Character (BPC)	1.25	—	Unverified
8	Large mLSTM	Bit per Character (BPC)	1.24	—	Unverified
9	AWD-LSTM (3 layers)	Bit per Character (BPC)	1.23	—	Unverified
10	Cluster-Former (#C=512)	Bit per Character (BPC)	1.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Smaller Transformer 126M (pre-trained)	Test perplexity	33	—	Unverified
2	OPT 125M	Test perplexity	32.26	—	Unverified
3	Larger Transformer 771M (pre-trained)	Test perplexity	28.1	—	Unverified
4	OPT 1.3B	Test perplexity	19.55	—	Unverified
5	GPT-Neo 125M	Test perplexity	17.83	—	Unverified
6	OPT 2.7B	Test perplexity	17.81	—	Unverified
7	Smaller Transformer 126M (fine-tuned)	Test perplexity	12	—	Unverified
8	GPT-Neo 1.3B	Test perplexity	11.46	—	Unverified
9	Transformer 125M	Test perplexity	10.7	—	Unverified
10	GPT-Neo 2.7B	Test perplexity	10.44	—	Unverified