Language Modelling

A language model is a model of natural language. Language models are useful for a variety of tasks, including speech recognition, machine translation, natural language generation (generating more human-like text), optical character recognition, route optimization, handwriting recognition, grammar induction, and information retrieval.

Large language models (LLMs), currently their most advanced form, are predominantly based on transformers trained on larger datasets (frequently using words scraped from the public internet). They have superseded recurrent neural network-based models, which had previously superseded the purely statistical models, such as word n-gram language model.

Source: Wikipedia

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10451–10500 of 17610 papers

Title	Date	Tasks	Status
Noise-Robust ASR for the third 'CHiME' Challenge Exploiting Time-Frequency Masking based Multi-Channel Speech Enhancement and Recurrent Neural Network	Sep 24, 2015	Language ModelingLanguage Modelling	—Unverified
Noise Robust IOA/CAS Speech Separation and Recognition System For The Third 'CHIME' Challenge	Sep 21, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Noisin: Unbiased Regularization for Recurrent Neural Networks	May 3, 2018	Language ModelingLanguage Modelling	—Unverified
Noisy Channel for Automatic Text Simplification	Nov 6, 2022	Language ModelingLanguage Modelling	—Unverified
Noisy Channel for Low Resource Grammatical Error Correction	Aug 1, 2019	Grammatical Error CorrectionLanguage Modeling	—Unverified
Noisy Neural Language Modeling for Typing Prediction in BCI Communication	Jun 1, 2019	Brain Computer InterfaceLanguage Modeling	—Unverified
Noisy Parallel Approximate Decoding for Conditional Recurrent Language Model	May 12, 2016	Language ModelingLanguage Modelling	—Unverified
No more hard prompts: SoftSRV prompting for synthetic data generation	Oct 21, 2024	Language ModelingLanguage Modelling	—Unverified
LaPuda: LLM-Enabled Policy-Based Query Optimizer for Multi-modal Data	Mar 20, 2024	Language ModellingLarge Language Model	—Unverified
Non-autoregressive End-to-end Speech Translation with Parallel Autoregressive Rescoring	Sep 9, 2021	CPUDecoder	—Unverified
Non-autoregressive Transformer-based End-to-end ASR using BERT	Apr 10, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Nondeterministic Stacks in Neural Networks	Apr 25, 2023	Language ModelingLanguage Modelling	—Unverified
No Need for a Lexicon? Evaluating the Value of the Pronunciation Lexica in End-to-End Models	Dec 5, 2017	Language ModelingLanguage Modelling	—Unverified
No Need to Know Everything! Efficiently Augmenting Language Models With External Knowledge	Sep 3, 2021	Language ModelingLanguage Modelling	—Unverified
No Need to Talk: Asynchronous Mixture of Language Models	Oct 4, 2024	Language ModelingLanguage Modelling	—Unverified
No News is Good News: A Critique of the One Billion Word Benchmark	Oct 25, 2021	Language ModelingLanguage Modelling	—Unverified
Non-iterative Parallel Text Generation via Glancing Transformer	Jan 1, 2021	Language ModelingLanguage Modelling	—Unverified
Non-Linear Text Regression with a Deep Convolutional Neural Network	Jul 1, 2015	Feature EngineeringLanguage Modelling	—Unverified
Nonparametric Bayesian Double Articulation Analyzer for Direct Language Acquisition from Continuous Speech Signals	Jun 22, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Nonparametric Bayesian Semi-supervised Word Segmentation	Jan 1, 2017	Language ModelingLanguage Modelling	—Unverified
Noobs at Semeval-2021 Task 4: Masked Language Modeling for abstract answer prediction	Aug 1, 2021	Language ModelingLanguage Modelling	—Unverified
Normality Addition via Normality Detection in Industrial Image Anomaly Detection Models	Jul 29, 2024	Anomaly DetectionLanguage Modeling	—Unverified
Normalizador de Texto para Lingua Portuguesa baseado em Modelo de Linguagem (A Normalizer based on Language Model for Texts in Portuguese)[In Portuguese]	Oct 1, 2017	Language ModelingLanguage Modelling	—Unverified
Normalized Log-Linear Interpolation of Backoff Language Models is Efficient	Aug 1, 2016	Language ModelingLanguage Modelling	—Unverified
Normalizing Text using Language Modelling based on Phonetics and String Similarity	Jun 25, 2020	Language ModelingLanguage Modelling	—Unverified
Normalizing the Normalizers: Comparing and Extending Network Normalization Schemes	Nov 14, 2016	image-classificationImage Classification	—Unverified
Normalizing tweets with edit scripts and recurrent neural embeddings	Jun 1, 2014	Boundary DetectionLanguage Modelling	—Unverified
NormFormer: Improved Transformer Pretraining with Extra Normalization	Oct 18, 2021	Language ModelingLanguage Modelling	—Unverified
NOTA: Multimodal Music Notation Understanding for Visual Large Language Model	Feb 17, 2025	cross-modal alignmentLanguage Modeling	—Unverified
NoteLLM: A Retrievable Large Language Model for Note Recommendation	Mar 4, 2024	Contrastive LearningLanguage Modeling	—Unverified
Not Enough Data? Deep Learning to the Rescue!	Nov 8, 2019	Data AugmentationDeep Learning	—Unverified
Not Quite 'Ask a Librarian': AI on the Nature, Value, and Future of LIS	Jul 7, 2021	Language ModelingLanguage Modelling	—Unverified
Not-so fine-tuning: Measures of Common Sense for Language Models	Sep 29, 2021	Common Sense ReasoningGPU	—Unverified
Nova: Generative Language Models for Assembly Code with Hierarchical Attention and Contrastive Learning	Nov 22, 2023	Code GenerationCode Translation	—Unverified
Novel Natural Language Summarization of Program Code via Leveraging Multiple Input Representations	Nov 1, 2021	Auxiliary LearningCode Summarization	—Unverified
Novel-WD: Exploring acquisition of Novel World Knowledge in LLMs Using Prefix-Tuning	Aug 30, 2024	Causal Language ModelingContinual Learning	—Unverified
Novel Word Embedding and Translation-based Language Modeling for Extractive Speech Summarization	Jul 22, 2016	Language ModelingLanguage Modelling	—Unverified
Novice Type Error Diagnosis with Natural Language Models	Oct 7, 2022	Language ModelingLanguage Modelling	—Unverified
Nowcasting the euro area with social media data	Jun 12, 2025	Language ModelingLanguage Modelling	—Unverified
Now It Sounds Like You: Learning Personalized Vocabulary On Device	May 5, 2023	Federated LearningLanguage Modeling	—Unverified
N-Shot Learning for Augmenting Task-Oriented Dialogue State Tracking	Oct 16, 2021	Dialogue State TrackingLanguage Modeling	—Unverified
NS-Hunter: BERT-Cloze Based Semantic Denoising for Distantly Supervised Relation Classification	Aug 1, 2021	ClassificationDenoising	—Unverified
NSNQuant: A Double Normalization Approach for Calibration-Free Low-Bit Vector Quantization of KV Cache	May 23, 2025	Language ModelingLanguage Modelling	—Unverified
NSP-BERT: A Prompt-based Few-Shot Learner through an Original Pre-training Task —— Next Sentence Prediction	Oct 1, 2022	Entity LinkingLanguage Modeling	—Unverified
NSP-BERT: A Prompt-based Few-Shot Learner Through an Original Pre-training Task--Next Sentence Prediction	Sep 8, 2021	Entity LinkingLanguage Modeling	—Unverified
NSP-BERT: A Prompt-based Zero-Shot Learner Through an Original Pre-training Task —— Next Sentence Prediction	Nov 16, 2021	Entity LinkingLanguage Modeling	—Unverified
NSP-NER: A Prompt-based Learner for Few-shot NER Driven by Next Sentence Prediction	Nov 16, 2021	Few-Shot LearningFew-shot NER	—Unverified
NTPP: Generative Speech Language Modeling for Dual-Channel Spoken Dialogue via Next-Token-Pair Prediction	Jun 1, 2025	DecoderLanguage Modeling	—Unverified
NTULM: Enriching Social Media Text Representations with Non-Textual Units	Oct 29, 2022	Language ModelingLanguage Modelling	—Unverified
NTU Speechlab LLM-Based Multilingual ASR System for Interspeech MLC-SLM Challenge 2025	Jun 16, 2025	Automatic Speech RecognitionLanguage Modeling	—Unverified

Show:10 25 50

← PrevPage 210 of 353Next →

All datasets WikiText-103 Penn Treebank (Word Level)enwik8 The Pile WikiText-2 LAMBADA One Billion Word Text8 Penn Treebank (Character Level)Hutter Prize OpenWebText SALMon

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Decay RNN	Validation perplexity	76.67	—	Unverified
2	GRU	Validation perplexity	53.78	—	Unverified
3	LSTM	Validation perplexity	52.73	—	Unverified
4	LSTM	Test perplexity	48.7	—	Unverified
5	Temporal CNN	Test perplexity	45.2	—	Unverified
6	TCN	Test perplexity	45.19	—	Unverified
7	GCNN-8	Test perplexity	44.9	—	Unverified
8	Neural cache model (size = 100)	Test perplexity	44.8	—	Unverified
9	Neural cache model (size = 2,000)	Test perplexity	40.8	—	Unverified
10	GPT-2 Small	Test perplexity	37.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TCN	Test perplexity	108.47	—	Unverified
2	Seq-U-Net	Test perplexity	107.95	—	Unverified
3	GRU (Bai et al., 2018)	Test perplexity	92.48	—	Unverified
4	R-Transformer	Test perplexity	84.38	—	Unverified
5	Zaremba et al. (2014) - LSTM (medium)	Test perplexity	82.7	—	Unverified
6	Gal & Ghahramani (2016) - Variational LSTM (medium)	Test perplexity	79.7	—	Unverified
7	LSTM (Bai et al., 2018)	Test perplexity	78.93	—	Unverified
8	Zaremba et al. (2014) - LSTM (large)	Test perplexity	78.4	—	Unverified
9	Gal & Ghahramani (2016) - Variational LSTM (large)	Test perplexity	75.2	—	Unverified
10	Inan et al. (2016) - Variational RHN	Test perplexity	66	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSTM (7 layers)	Bit per Character (BPC)	1.67	—	Unverified
2	Hypernetworks	Bit per Character (BPC)	1.34	—	Unverified
3	SHA-LSTM (4 layers, h=1024, no attention head)	Bit per Character (BPC)	1.33	—	Unverified
4	LN HM-LSTM	Bit per Character (BPC)	1.32	—	Unverified
5	ByteNet	Bit per Character (BPC)	1.31	—	Unverified
6	Recurrent Highway Networks	Bit per Character (BPC)	1.27	—	Unverified
7	Large FS-LSTM-4	Bit per Character (BPC)	1.25	—	Unverified
8	Large mLSTM	Bit per Character (BPC)	1.24	—	Unverified
9	AWD-LSTM (3 layers)	Bit per Character (BPC)	1.23	—	Unverified
10	Cluster-Former (#C=512)	Bit per Character (BPC)	1.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Smaller Transformer 126M (pre-trained)	Test perplexity	33	—	Unverified
2	OPT 125M	Test perplexity	32.26	—	Unverified
3	Larger Transformer 771M (pre-trained)	Test perplexity	28.1	—	Unverified
4	OPT 1.3B	Test perplexity	19.55	—	Unverified
5	GPT-Neo 125M	Test perplexity	17.83	—	Unverified
6	OPT 2.7B	Test perplexity	17.81	—	Unverified
7	Smaller Transformer 126M (fine-tuned)	Test perplexity	12	—	Unverified
8	GPT-Neo 1.3B	Test perplexity	11.46	—	Unverified
9	Transformer 125M	Test perplexity	10.7	—	Unverified
10	GPT-Neo 2.7B	Test perplexity	10.44	—	Unverified