Language Modelling

A language model is a model of natural language. Language models are useful for a variety of tasks, including speech recognition, machine translation, natural language generation (generating more human-like text), optical character recognition, route optimization, handwriting recognition, grammar induction, and information retrieval.

Large language models (LLMs), currently their most advanced form, are predominantly based on transformers trained on larger datasets (frequently using words scraped from the public internet). They have superseded recurrent neural network-based models, which had previously superseded the purely statistical models, such as word n-gram language model.

Source: Wikipedia

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1101–1150 of 17610 papers

Title	Date	Tasks	Status	Hype
EduChat: A Large-Scale Language Model-based Chatbot System for Intelligent Education	Aug 5, 2023	ChatbotLanguage Modeling	CodeCode Available	2
ConceptLab: Creative Concept Generation using VLM-Guided Diffusion Prior Constraints	Aug 3, 2023	Image GenerationLanguage Modelling	CodeCode Available	2
LP-MusicCaps: LLM-Based Pseudo Music Captioning	Jul 31, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
Distilled Feature Fields Enable Few-Shot Language-Guided Manipulation	Jul 27, 2023	3D geometryFew-Shot Learning	CodeCode Available	2
TransNormerLLM: A Faster and Better Large Language Model with Improved TransNormer	Jul 27, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
A Systematic Survey of Prompt Engineering on Vision-Language Foundation Models	Jul 24, 2023	Image GenerationImage-text matching	CodeCode Available	2
FLASK: Fine-grained Language Model Evaluation based on Alignment Skill Sets	Jul 20, 2023	Instruction FollowingLanguage Model Evaluation	CodeCode Available	2
DialogStudio: Towards Richest and Most Diverse Unified Dataset Collection for Conversational AI	Jul 19, 2023	Conversational RecommendationDiversity	CodeCode Available	2
Planting a SEED of Vision in Large Language Model	Jul 16, 2023	Image GenerationImage to text	CodeCode Available	2
Disco-Bench: A Discourse-Aware Evaluation Benchmark for Language Modelling	Jul 16, 2023	DiagnosticLanguage Modelling	CodeCode Available	2
Think-on-Graph: Deep and Responsible Reasoning of Large Language Model on Knowledge Graph	Jul 15, 2023	HallucinationKnowledge Graphs	CodeCode Available	2
Drive Like a Human: Rethinking Autonomous Driving with Large Language Models	Jul 14, 2023	Autonomous DrivingCommon Sense Reasoning	CodeCode Available	2
Generating Benchmarks for Factuality Evaluation of Language Models	Jul 13, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
VoxPoser: Composable 3D Value Maps for Robotic Manipulation with Language Models	Jul 12, 2023	FormLanguage Modelling	CodeCode Available	2
GPT4RoI: Instruction Tuning Large Language Model on Region-of-Interest	Jul 7, 2023	AttributeCommon Sense Reasoning	CodeCode Available	2
Lost in the Middle: How Language Models Use Long Contexts	Jul 6, 2023	Language ModellingPosition	CodeCode Available	2
What Matters in Training a GPT4-Style Language Model with Multimodal Inputs?	Jul 5, 2023	Instruction FollowingLanguage Modeling	CodeCode Available	2
MedCPT: Contrastive Pre-trained Transformers with Large-scale PubMed Search Logs for Zero-shot Biomedical Information Retrieval	Jul 2, 2023	Biomedical Information RetrievalContrastive Learning	CodeCode Available	2
BatGPT: A Bidirectional Autoregessive Talker from Generative Pre-trained Transformer	Jul 1, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
Provable Robust Watermarking for AI-Generated Text	Jun 30, 2023	Language Modelling	CodeCode Available	2
Most Language Models can be Poets too: An AI Writing Assistant and Constrained Text Generation Studio	Jun 28, 2023	Language ModellingText Generation	CodeCode Available	2
Towards Language Models That Can See: Computer Vision Through the LENS of Natural Language	Jun 28, 2023	DescriptiveLanguage Modeling	CodeCode Available	2
HyenaDNA: Long-Range Genomic Sequence Modeling at Single Nucleotide Resolution	Jun 27, 2023	4kIn-Context Learning	CodeCode Available	2
MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models	Jun 23, 2023	BenchmarkingLanguage Modeling	CodeCode Available	2
RS5M and GeoRSCLIP: A Large Scale Vision-Language Dataset and A Large Vision-Language Model for Remote Sensing	Jun 20, 2023	Cross-Modal RetrievalImage Retrieval	CodeCode Available	2
XrayGPT: Chest Radiographs Summarization using Medical Vision-Language Models	Jun 13, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
Valley: Video Assistant with Large Language model Enhanced abilitY	Jun 12, 2023	Action RecognitionInstruction Following	CodeCode Available	2
K2: A Foundation Language Model for Geoscience Knowledge Understanding and Utilization	Jun 8, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
RETA-LLM: A Retrieval-Augmented Large Language Model Toolkit	Jun 8, 2023	Answer GenerationFact Checking	CodeCode Available	2
PIXIU: A Large Language Model, Instruction Data and Evaluation Benchmark for Finance	Jun 8, 2023	Conversational Question AnsweringLanguage Modeling	CodeCode Available	2
PandaLM: An Automatic Evaluation Benchmark for LLM Instruction Tuning Optimization	Jun 8, 2023	Language ModellingLarge Language Model	CodeCode Available	2
Youku-mPLUG: A 10 Million Large-scale Chinese Video-Language Dataset for Pre-training and Benchmarks	Jun 7, 2023	Cross-Modal RetrievalLanguage Modelling	CodeCode Available	2
ModuleFormer: Modularity Emerges from Mixture-of-Experts	Jun 7, 2023	Language ModellingLightweight Deployment	CodeCode Available	2
Inference-Time Intervention: Eliciting Truthful Answers from a Language Model	Jun 6, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
SpQR: A Sparse-Quantized Representation for Near-Lossless LLM Weight Compression	Jun 5, 2023	GPULanguage Modelling	CodeCode Available	2
User Behavior Simulation with Large Language Model based Agents	Jun 5, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
Fine-Grained Human Feedback Gives Better Rewards for Language Model Training	Jun 2, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
MERT: Acoustic Music Understanding Model with Large-Scale Self-supervised Training	May 31, 2023	Language ModellingQuantization	CodeCode Available	2
GPT4Tools: Teaching Large Language Model to Use Tools via Self-instruction	May 30, 2023	Image GenerationInstruction Following	CodeCode Available	2
Blockwise Parallel Transformer for Large Context Models	May 30, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
Multiscale Positive-Unlabeled Detection of AI-Generated Texts	May 29, 2023	Language Modellingtext-classification	CodeCode Available	2
VAST: A Vision-Audio-Subtitle-Text Omni-Modality Foundation Model and Dataset	May 29, 2023	Audio captioningAudio-Visual Captioning	CodeCode Available	2
KoSBi: A Dataset for Mitigating Social Bias Risks Towards Safer Large Language Model Application	May 28, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
Language Models Can Improve Event Prediction by Few-Shot Abductive Reasoning	May 26, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
Adapting Language Models to Compress Contexts	May 24, 2023	In-Context LearningLanguage Modeling	CodeCode Available	2
ExpertPrompting: Instructing Large Language Models to be Distinguished Experts	May 24, 2023	In-Context LearningInstruction Following	CodeCode Available	2
Sophia: A Scalable Stochastic Second-order Optimizer for Language Model Pre-training	May 23, 2023	Language ModelingLanguage Modelling	CodeCode Available	2
LLM-grounded Diffusion: Enhancing Prompt Understanding of Text-to-Image Diffusion Models with Large Language Models	May 23, 2023	Common Sense ReasoningImage Generation	CodeCode Available	2
FActScore: Fine-grained Atomic Evaluation of Factual Precision in Long Form Text Generation	May 23, 2023	FormLanguage Modelling	CodeCode Available	2
Improving Factuality and Reasoning in Language Models through Multiagent Debate	May 23, 2023	Few-Shot LearningLanguage Modeling	CodeCode Available	2

Show:10 25 50

← PrevPage 23 of 353Next →

All datasets WikiText-103 Penn Treebank (Word Level)enwik8 The Pile WikiText-2 LAMBADA One Billion Word Text8 Penn Treebank (Character Level)Hutter Prize OpenWebText SALMon

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Decay RNN	Validation perplexity	76.67	—	Unverified
2	GRU	Validation perplexity	53.78	—	Unverified
3	LSTM	Validation perplexity	52.73	—	Unverified
4	LSTM	Test perplexity	48.7	—	Unverified
5	Temporal CNN	Test perplexity	45.2	—	Unverified
6	TCN	Test perplexity	45.19	—	Unverified
7	GCNN-8	Test perplexity	44.9	—	Unverified
8	Neural cache model (size = 100)	Test perplexity	44.8	—	Unverified
9	Neural cache model (size = 2,000)	Test perplexity	40.8	—	Unverified
10	GPT-2 Small	Test perplexity	37.5	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TCN	Test perplexity	108.47	—	Unverified
2	Seq-U-Net	Test perplexity	107.95	—	Unverified
3	GRU (Bai et al., 2018)	Test perplexity	92.48	—	Unverified
4	R-Transformer	Test perplexity	84.38	—	Unverified
5	Zaremba et al. (2014) - LSTM (medium)	Test perplexity	82.7	—	Unverified
6	Gal & Ghahramani (2016) - Variational LSTM (medium)	Test perplexity	79.7	—	Unverified
7	LSTM (Bai et al., 2018)	Test perplexity	78.93	—	Unverified
8	Zaremba et al. (2014) - LSTM (large)	Test perplexity	78.4	—	Unverified
9	Gal & Ghahramani (2016) - Variational LSTM (large)	Test perplexity	75.2	—	Unverified
10	Inan et al. (2016) - Variational RHN	Test perplexity	66	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSTM (7 layers)	Bit per Character (BPC)	1.67	—	Unverified
2	Hypernetworks	Bit per Character (BPC)	1.34	—	Unverified
3	SHA-LSTM (4 layers, h=1024, no attention head)	Bit per Character (BPC)	1.33	—	Unverified
4	LN HM-LSTM	Bit per Character (BPC)	1.32	—	Unverified
5	ByteNet	Bit per Character (BPC)	1.31	—	Unverified
6	Recurrent Highway Networks	Bit per Character (BPC)	1.27	—	Unverified
7	Large FS-LSTM-4	Bit per Character (BPC)	1.25	—	Unverified
8	Large mLSTM	Bit per Character (BPC)	1.24	—	Unverified
9	AWD-LSTM (3 layers)	Bit per Character (BPC)	1.23	—	Unverified
10	Cluster-Former (#C=512)	Bit per Character (BPC)	1.22	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Smaller Transformer 126M (pre-trained)	Test perplexity	33	—	Unverified
2	OPT 125M	Test perplexity	32.26	—	Unverified
3	Larger Transformer 771M (pre-trained)	Test perplexity	28.1	—	Unverified
4	OPT 1.3B	Test perplexity	19.55	—	Unverified
5	GPT-Neo 125M	Test perplexity	17.83	—	Unverified
6	OPT 2.7B	Test perplexity	17.81	—	Unverified
7	Smaller Transformer 126M (fine-tuned)	Test perplexity	12	—	Unverified
8	GPT-Neo 1.3B	Test perplexity	11.46	—	Unverified
9	Transformer 125M	Test perplexity	10.7	—	Unverified
10	GPT-Neo 2.7B	Test perplexity	10.44	—	Unverified