Language Modelling

A language model is a model of natural language. Language models are useful for a variety of tasks, including speech recognition, machine translation, natural language generation (generating more human-like text), optical character recognition, route optimization, handwriting recognition, grammar induction, and information retrieval.

Large language models (LLMs), currently their most advanced form, are predominantly based on transformers trained on larger datasets (frequently using words scraped from the public internet). They have superseded recurrent neural network-based models, which had previously superseded the purely statistical models, such as word n-gram language model.

Source: Wikipedia

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5701–5750 of 17610 papers

Title	Date	Tasks	Status
A Hierarchical Multi-Modal Encoder for Moment Localization in Video Corpus	Nov 18, 2020	Language ModelingLanguage Modelling	—Unverified
A Hierarchical Neural Framework for Classification and its Explanation in Large Unstructured Legal Documents	Sep 19, 2023	ClusteringLanguage Modelling	—Unverified
A Hierarchical Transformer for Unsupervised Parsing	Mar 30, 2020	Language Modelling	—Unverified
A Hierarchical Word Sequence Language Model	Dec 1, 2014	Language ModelingLanguage Modelling	—Unverified
A Holistic Assessment of the Carbon Footprint of Noor, a Very Large Arabic Language Model	May 1, 2022	Language ModelingLanguage Modelling	—Unverified
A Hybrid Approach To Aspect Based Sentiment Analysis Using Transfer Learning	Mar 25, 2024	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	—Unverified
A Hybrid Approach to Grapheme-Phoneme Conversion	Jan 1, 2015	Language Modelling	—Unverified
A Hybrid Approach to Skeleton-based Translation	Jun 1, 2014	Language ModellingMachine Translation	—Unverified
A Hybrid Attention Framework for Fake News Detection with Large Language Models	Jan 21, 2025	Fake News DetectionLanguage Modeling	—Unverified
A Hybrid Chinese Spelling Correction Using Language Model and Statistical Machine Translation with Reranking	Oct 1, 2013	Language ModelingLanguage Modelling	—Unverified
A Hybrid Learning Scheme for Chinese Word Embedding	Jul 1, 2018	Language ModelingLanguage Modelling	—Unverified
A Hybrid Model for Enhancing Lexical Statistical Machine Translation (SMT)	Jun 3, 2015	Language ModelingLanguage Modelling	—Unverified
A Hybrid Neural Network Model for Commonsense Reasoning	Jul 27, 2019	Common Sense ReasoningCoreference Resolution	—Unverified
A hypothesize-and-verify framework for Text Recognition using Deep Recurrent Neural Networks	Feb 26, 2015	Language ModelingLanguage Modelling	—Unverified
AI2MMUM: AI-AI Oriented Multi-Modal Universal Model Leveraging Telecom Domain Large Model	May 15, 2025	Language ModelingLanguage Modelling	—Unverified
AI Accelerators for Large Language Model In-ference: Architecture Analysis and Scaling Strategies	May 13, 2025	GPULanguage Modeling	—Unverified
AI and the FCI: Can ChatGPT Project an Understanding of Introductory Physics?	Mar 2, 2023	ChatbotCollege Physics	—Unverified
AI-Assisted Assessment of Coding Practices in Modern Code Review	May 22, 2024	Language ModelingLanguage Modelling	—Unverified
AI Based Font Pair Suggestion Modelling For Graphic Design	Jan 19, 2025	Language ModelingLanguage Modelling	—Unverified
AI Chains: Transparent and Controllable Human-AI Interaction by Chaining Large Language Model Prompts	Oct 4, 2021	Language ModelingLanguage Modelling	—Unverified
AI Chat Assistants can Improve Conversations about Divisive Topics	Feb 14, 2023	Language ModelingLanguage Modelling	—Unverified
AID: Adapting Image2Video Diffusion Models for Instruction-guided Video Prediction	Jun 10, 2024	Language ModellingLarge Language Model	—Unverified
AIDE: Agentically Improve Visual Language Model with Domain Experts	Feb 13, 2025	Knowledge DistillationLanguage Modeling	—Unverified
AI Delegates with a Dual Focus: Ensuring Privacy and Strategic Self-Disclosure	Sep 26, 2024	Language ModelingLanguage Modelling	—Unverified
AI-Driven Reinvention of Hydrological Modeling for Accurate Predictions and Interpretation to Transform Earth System Modeling	Jan 7, 2025	Language ModelingLanguage Modelling	—Unverified
Strategic Responses to Technological Change: Evidence from Online Labor Markets	Mar 22, 2024	Language ModellingPosition	—Unverified
AI for All: Operationalising Diversity and Inclusion Requirements for AI Systems	Nov 7, 2023	AllDecision Making	—Unverified
AI for Biomedicine in the Era of Large Language Models	Mar 23, 2024	Language ModelingLanguage Modelling	—Unverified
AI Foundation Models for Weather and Climate: Applications, Design, and Implementation	Sep 19, 2023	Language ModelingLanguage Modelling	—Unverified
AI-KU: Using Co-Occurrence Modeling for Semantic Similarity	Aug 1, 2014	Information RetrievalLanguage Modelling	—Unverified
AI-KU: Using Substitute Vectors and Co-Occurrence Modeling For Word Sense Induction and Disambiguation	Jun 1, 2013	Graph ClusteringLanguage Modelling	—Unverified
AI Managed Emergency Documentation with a Pretrained Model	Aug 17, 2024	Language ModelingLanguage Modelling	—Unverified
AI-Mediated Code Comment Improvement	May 13, 2025	Language ModelingLanguage Modelling	—Unverified
AI Metropolis: Scaling Large Language Model-based Multi-Agent Simulation with Out-of-order Execution	Nov 5, 2024	Language ModelingLanguage Modelling	—Unverified
AI-native Interconnect Framework for Integration of Large Language Model Technologies in 6G Systems	Nov 10, 2023	Language ModelingLanguage Modelling	—Unverified
AI on AI: Exploring the Utility of GPT as an Expert Annotator of AI Publications	Mar 14, 2024	ChatbotLanguage Modelling	—Unverified
AI Policy Projector: Grounding LLM Policy Design in Iterative Mapmaking	Sep 26, 2024	Language ModelingLanguage Modelling	—Unverified
AI-Facilitated Episodic Future Thinking For Adults with Obesity	Mar 8, 2025	ChatbotLanguage Modeling	—Unverified
AI-Powered Immersive Assistance for Interactive Task Execution in Industrial Environments	Jul 12, 2024	Language ModelingLanguage Modelling	—Unverified
AirCache: Activating Inter-modal Relevancy KV Cache Compression for Efficient Large Vision-Language Model Inference	Mar 31, 2025	Language ModelingLanguage Modelling	—Unverified
AirGapAgent: Protecting Privacy-Conscious Conversational Agents	May 8, 2024	Language ModelingLanguage Modelling	—Unverified
AI Safety in Generative AI Large Language Models: A Survey	Jul 6, 2024	Language ModellingLarge Language Model	—Unverified
AI Sensing for Robotics using Deep Learning based Visual and Language Modeling	Jul 1, 2020	Image CaptioningLanguage Modeling	—Unverified
AISPACE at SemEval-2024 task 8: A Class-balanced Soft-voting System for Detecting Multi-generator Machine-generated Text	Apr 1, 2024	DecoderLanguage Modeling	—Unverified
AI-VERDE: A Gateway for Egalitarian Access to Large Language Model-Based Resources For Educational Institutions	Feb 11, 2025	Language ModelingLanguage Modelling	—Unverified
A Joint Dependency Model of Morphological and Syntactic Structure for Statistical Machine Translation	Sep 1, 2015	Language ModellingMachine Translation	—Unverified
A Joint Model for Semantic Sequences: Frames, Entities, Sentiments	Aug 1, 2017	Cloze TestDiscourse Parsing	—Unverified
A Joint Model of Language and Perception for Grounded Attribute Learning	Jun 27, 2012	AttributeLanguage Modeling	—Unverified
Akamon: An Open Source Toolkit for Tree/Forest-Based Statistical Machine Translation	Jul 1, 2012	Language ModellingMachine Translation	—Unverified
A Knowledge-Component-Based Methodology for Evaluating AI Assistants	Jun 9, 2024	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 115 of 353Next →

All datasets WikiText-103 Penn Treebank (Word Level)enwik8 The Pile WikiText-2 LAMBADA One Billion Word Text8 Penn Treebank (Character Level)Hutter Prize OpenWebText SALMon

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Decay RNN	Validation perplexity	76.67	—	Unverified
2	GRU	Validation perplexity	53.78	—	Unverified
3	LSTM	Validation perplexity	52.73	—	Unverified
4	LSTM	Test perplexity	48.7	—	Unverified
5	Temporal CNN	Test perplexity	45.2	—	Unverified
6	TCN	Test perplexity	45.19	—	Unverified
7	GCNN-8	Test perplexity	44.9	—	Unverified
8	Neural cache model (size = 100)	Test perplexity	44.8	—	Unverified
9	Neural cache model (size = 2,000)	Test perplexity	40.8	—	Unverified
10	GPT-2 Small	Test perplexity	37.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TCN	Test perplexity	108.47	—	Unverified
2	Seq-U-Net	Test perplexity	107.95	—	Unverified
3	GRU (Bai et al., 2018)	Test perplexity	92.48	—	Unverified
4	R-Transformer	Test perplexity	84.38	—	Unverified
5	Zaremba et al. (2014) - LSTM (medium)	Test perplexity	82.7	—	Unverified
6	Gal & Ghahramani (2016) - Variational LSTM (medium)	Test perplexity	79.7	—	Unverified
7	LSTM (Bai et al., 2018)	Test perplexity	78.93	—	Unverified
8	Zaremba et al. (2014) - LSTM (large)	Test perplexity	78.4	—	Unverified
9	Gal & Ghahramani (2016) - Variational LSTM (large)	Test perplexity	75.2	—	Unverified
10	Inan et al. (2016) - Variational RHN	Test perplexity	66	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSTM (7 layers)	Bit per Character (BPC)	1.67	—	Unverified
2	Hypernetworks	Bit per Character (BPC)	1.34	—	Unverified
3	SHA-LSTM (4 layers, h=1024, no attention head)	Bit per Character (BPC)	1.33	—	Unverified
4	LN HM-LSTM	Bit per Character (BPC)	1.32	—	Unverified
5	ByteNet	Bit per Character (BPC)	1.31	—	Unverified
6	Recurrent Highway Networks	Bit per Character (BPC)	1.27	—	Unverified
7	Large FS-LSTM-4	Bit per Character (BPC)	1.25	—	Unverified
8	Large mLSTM	Bit per Character (BPC)	1.24	—	Unverified
9	AWD-LSTM (3 layers)	Bit per Character (BPC)	1.23	—	Unverified
10	Cluster-Former (#C=512)	Bit per Character (BPC)	1.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Smaller Transformer 126M (pre-trained)	Test perplexity	33	—	Unverified
2	OPT 125M	Test perplexity	32.26	—	Unverified
3	Larger Transformer 771M (pre-trained)	Test perplexity	28.1	—	Unverified
4	OPT 1.3B	Test perplexity	19.55	—	Unverified
5	GPT-Neo 125M	Test perplexity	17.83	—	Unverified
6	OPT 2.7B	Test perplexity	17.81	—	Unverified
7	Smaller Transformer 126M (fine-tuned)	Test perplexity	12	—	Unverified
8	GPT-Neo 1.3B	Test perplexity	11.46	—	Unverified
9	Transformer 125M	Test perplexity	10.7	—	Unverified
10	GPT-Neo 2.7B	Test perplexity	10.44	—	Unverified