Language Modelling

A language model is a model of natural language. Language models are useful for a variety of tasks, including speech recognition, machine translation, natural language generation (generating more human-like text), optical character recognition, route optimization, handwriting recognition, grammar induction, and information retrieval.

Large language models (LLMs), currently their most advanced form, are predominantly based on transformers trained on larger datasets (frequently using words scraped from the public internet). They have superseded recurrent neural network-based models, which had previously superseded the purely statistical models, such as word n-gram language model.

Source: Wikipedia

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6651–6700 of 17610 papers

Title	Date	Tasks	Status
EchoPrime: A Multi-Video View-Informed Vision-Language Model for Comprehensive Echocardiography Interpretation	Oct 13, 2024	Contrastive LearningLanguage Modeling	—Unverified
Adaptive Reasoning and Acting in Medical Language Agents	Oct 13, 2024	Decision MakingDiagnostic	—Unverified
COrAL: Order-Agnostic Language Modeling for Efficient Iterative Refinement	Oct 12, 2024	Code GenerationComputational Efficiency	CodeCode Available
Impeding LLM-assisted Cheating in Introductory Programming Assignments via Adversarial Perturbation	Oct 12, 2024	Code GenerationLanguage Modeling	—Unverified
Extended Japanese Commonsense Morality Dataset with Masked Token and Label Enhancement	Oct 12, 2024	Language ModellingLarge Language Model	—Unverified
LINKED: Eliciting, Filtering and Integrating Knowledge in Large Language Model for Commonsense Reasoning	Oct 12, 2024	Knowledge GraphsLanguage Modeling	CodeCode Available
Language-Model-Assisted Bi-Level Programming for Reward Learning from Internet Videos	Oct 11, 2024	Language ModelingLanguage Modelling	—Unverified
LLMD: A Large Language Model for Interpreting Longitudinal Medical Records	Oct 11, 2024	Language ModelingLanguage Modelling	—Unverified
Emergent social conventions and collective bias in LLM populations	Oct 11, 2024	Language ModelingLanguage Modelling	—Unverified
Preferential Normalizing Flows	Oct 11, 2024	Language ModelingLanguage Modelling	—Unverified
nach0-pc: Multi-task Language Model with Molecular Point Cloud Encoder	Oct 11, 2024	Drug DiscoveryLanguage Modeling	—Unverified
SocialGaze: Improving the Integration of Human Social Norms in Large Language Models	Oct 11, 2024	Language ModelingLanguage Modelling	CodeCode Available
SimpleStrat: Diversifying Language Model Generation with Stratification	Oct 11, 2024	DiversityLanguage Modeling	—Unverified
MedMobile: A mobile-sized language model with expert-level clinical capabilities	Oct 11, 2024	Language ModelingLanguage Modelling	CodeCode Available
The Same But Different: Structural Similarities and Differences in Multilingual Language Modeling	Oct 11, 2024	Language ModelingLanguage Modelling	—Unverified
Simultaneous Reward Distillation and Preference Learning: Get You a Language Model Who Can Do Both	Oct 11, 2024	Knowledge DistillationLanguage Modeling	—Unverified
Lifelong Event Detection via Optimal Transport	Oct 11, 2024	Event DetectionLanguage Modeling	—Unverified
Towards Trustworthy Knowledge Graph Reasoning: An Uncertainty Aware Perspective	Oct 11, 2024	Conformal PredictionKnowledge Graphs	—Unverified
ViT3D Alignment of LLaMA3: 3D Medical Image Report Generation	Oct 11, 2024	DiagnosticLanguage Modeling	—Unverified
VLM See, Robot Do: Human Demo Video to Robot Action Plan via Vision Language Model	Oct 11, 2024	Common Sense ReasoningLanguage Modeling	—Unverified
Distributionally robust self-supervised learning for tabular data	Oct 11, 2024	DecoderLanguage Modeling	CodeCode Available
Efficiently Scanning and Resampling Spatio-Temporal Tasks with Irregular Observations	Oct 11, 2024	Language ModelingLanguage Modelling	—Unverified
Hypothesis-only Biases in Large Language Model-Elicited Natural Language Inference	Oct 11, 2024	Language ModelingLanguage Modelling	—Unverified
Calibrated Cache Model for Few-Shot Vision-Language Model Adaptation	Oct 11, 2024	Language ModelingLanguage Modelling	—Unverified
ACER: Automatic Language Model Context Extension via Retrieval	Oct 11, 2024	Language ModelingLanguage Modelling	—Unverified
Generation with Dynamic Vocabulary	Oct 11, 2024	Language ModelingLanguage Modelling	CodeCode Available
Aerial Vision-and-Language Navigation via Semantic-Topo-Metric Representation Guided LLM Reasoning	Oct 11, 2024	Language ModelingLanguage Modelling	—Unverified
uto\!L: Autonomous Evaluation of LLMs for Truth Maintenance and Reasoning Tasks	Oct 11, 2024	BenchmarkingLanguage Modeling	—Unverified
Enterprise Benchmarks for Large Language Model Evaluation	Oct 11, 2024	BenchmarkingLanguage Model Evaluation	CodeCode Available
Can a large language model be a gaslighter?	Oct 11, 2024	Language ModelingLanguage Modelling	CodeCode Available
CrossQuant: A Post-Training Quantization Method with Smaller Quantization Kernel for Precise Large Language Model Compression	Oct 10, 2024	Language ModelingLanguage Modelling	—Unverified
A Framework for Collaborating a Large Language Model Tool in Brainstorming for Triggering Creative Thoughts	Oct 10, 2024	Language ModelingLanguage Modelling	—Unverified
HLM-Cite: Hybrid Language Model Workflow for Text-based Scientific Citation Prediction	Oct 10, 2024	Binary ClassificationCitation Prediction	CodeCode Available
Disease Entity Recognition and Normalization is Improved with Large Language Model Derived Synthetic Normalized Mentions	Oct 10, 2024	Data AugmentationKnowledge Graphs	—Unverified
Closing the Loop: Learning to Generate Writing Feedback via Language Model Simulated Student Revisions	Oct 10, 2024	Language ModelingLanguage Modelling	CodeCode Available
Semantic Self-Consistency: Enhancing Language Model Reasoning via Semantic Weighting	Oct 10, 2024	Language ModelingLanguage Modelling	—Unverified
DICE: Discrete Inversion Enabling Controllable Editing for Multinomial Diffusion and Masked Generative Models	Oct 10, 2024	Image GenerationLanguage Modeling	—Unverified
Efficient Reinforcement Learning with Large Language Model Priors	Oct 10, 2024	Bayesian InferenceDecision Making	—Unverified
Evolutionary Contrastive Distillation for Language Model Alignment	Oct 10, 2024	Contrastive LearningInstruction Following	—Unverified
Animating the Past: Reconstruct Trilobite via Video Generation	Oct 10, 2024	Language ModellingLarge Language Model	—Unverified
Mechanistic Permutability: Match Features Across Layers	Oct 10, 2024	DecoderLanguage Modeling	—Unverified
Sample then Identify: A General Framework for Risk Control and Assessment in Multimodal Large Language Models	Oct 10, 2024	Conformal PredictionLanguage Modeling	—Unverified
Promptly Yours? A Human Subject Study on Prompt Inference in AI-Generated Art	Oct 10, 2024	Language ModellingLarge Language Model	—Unverified
More Experts Than Galaxies: Conditionally-overlapping Experts With Biologically-Inspired Fixed Routing	Oct 10, 2024	image-classificationImage Classification	CodeCode Available
PLaMo-100B: A Ground-Up Language Model Designed for Japanese Proficiency	Oct 10, 2024	Language ModelingLanguage Modelling	—Unverified
The Large Language Model GreekLegalRoBERTa	Oct 10, 2024	Language ModelingLanguage Modelling	—Unverified
LecPrompt: A Prompt-based Approach for Logical Error Correction with CodeBERT	Oct 10, 2024	Language ModelingLanguage Modelling	—Unverified
Language model developers should report train-test overlap	Oct 10, 2024	Language ModelingLanguage Modelling	—Unverified
Uncovering Overfitting in Large Language Model Editing	Oct 10, 2024	AttributeIn-Context Learning	—Unverified
Plug-and-Play Performance Estimation for LLM Services without Relying on Labeled Data	Oct 10, 2024	In-Context LearningLanguage Modeling	CodeCode Available

Show:10 25 50

← PrevPage 134 of 353Next →

All datasets WikiText-103 Penn Treebank (Word Level)enwik8 The Pile WikiText-2 LAMBADA One Billion Word Text8 Penn Treebank (Character Level)Hutter Prize OpenWebText SALMon

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Decay RNN	Validation perplexity	76.67	—	Unverified
2	GRU	Validation perplexity	53.78	—	Unverified
3	LSTM	Validation perplexity	52.73	—	Unverified
4	LSTM	Test perplexity	48.7	—	Unverified
5	Temporal CNN	Test perplexity	45.2	—	Unverified
6	TCN	Test perplexity	45.19	—	Unverified
7	GCNN-8	Test perplexity	44.9	—	Unverified
8	Neural cache model (size = 100)	Test perplexity	44.8	—	Unverified
9	Neural cache model (size = 2,000)	Test perplexity	40.8	—	Unverified
10	GPT-2 Small	Test perplexity	37.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TCN	Test perplexity	108.47	—	Unverified
2	Seq-U-Net	Test perplexity	107.95	—	Unverified
3	GRU (Bai et al., 2018)	Test perplexity	92.48	—	Unverified
4	R-Transformer	Test perplexity	84.38	—	Unverified
5	Zaremba et al. (2014) - LSTM (medium)	Test perplexity	82.7	—	Unverified
6	Gal & Ghahramani (2016) - Variational LSTM (medium)	Test perplexity	79.7	—	Unverified
7	LSTM (Bai et al., 2018)	Test perplexity	78.93	—	Unverified
8	Zaremba et al. (2014) - LSTM (large)	Test perplexity	78.4	—	Unverified
9	Gal & Ghahramani (2016) - Variational LSTM (large)	Test perplexity	75.2	—	Unverified
10	Inan et al. (2016) - Variational RHN	Test perplexity	66	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSTM (7 layers)	Bit per Character (BPC)	1.67	—	Unverified
2	Hypernetworks	Bit per Character (BPC)	1.34	—	Unverified
3	SHA-LSTM (4 layers, h=1024, no attention head)	Bit per Character (BPC)	1.33	—	Unverified
4	LN HM-LSTM	Bit per Character (BPC)	1.32	—	Unverified
5	ByteNet	Bit per Character (BPC)	1.31	—	Unverified
6	Recurrent Highway Networks	Bit per Character (BPC)	1.27	—	Unverified
7	Large FS-LSTM-4	Bit per Character (BPC)	1.25	—	Unverified
8	Large mLSTM	Bit per Character (BPC)	1.24	—	Unverified
9	AWD-LSTM (3 layers)	Bit per Character (BPC)	1.23	—	Unverified
10	Cluster-Former (#C=512)	Bit per Character (BPC)	1.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Smaller Transformer 126M (pre-trained)	Test perplexity	33	—	Unverified
2	OPT 125M	Test perplexity	32.26	—	Unverified
3	Larger Transformer 771M (pre-trained)	Test perplexity	28.1	—	Unverified
4	OPT 1.3B	Test perplexity	19.55	—	Unverified
5	GPT-Neo 125M	Test perplexity	17.83	—	Unverified
6	OPT 2.7B	Test perplexity	17.81	—	Unverified
7	Smaller Transformer 126M (fine-tuned)	Test perplexity	12	—	Unverified
8	GPT-Neo 1.3B	Test perplexity	11.46	—	Unverified
9	Transformer 125M	Test perplexity	10.7	—	Unverified
10	GPT-Neo 2.7B	Test perplexity	10.44	—	Unverified