Language Modeling

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1026–1050 of 14182 papers

Title	Date	Tasks	Status	Hype
P-Tuning v2: Prompt Tuning Can Be Comparable to Fine-tuning Universally Across Scales and Tasks	Oct 14, 2021	Language ModelingLanguage Modelling	CodeCode Available	2
Deduplicating Training Data Makes Language Models Better	Jul 14, 2021	Language ModelingLanguage Modelling	CodeCode Available	2
FastMoE: A Fast Mixture-of-Expert Training System	Mar 24, 2021	GPULanguage Modeling	CodeCode Available	2
GPT Understands, Too	Mar 18, 2021	Knowledge ProbingLanguage Modeling	CodeCode Available	2
When Attention Meets Fast Recurrence: Training Language Models with Reduced Compute	Feb 24, 2021	GPULanguage Modeling	CodeCode Available	2
Tokens-to-Token ViT: Training Vision Transformers from Scratch on ImageNet	Jan 28, 2021	image-classificationImage Classification	CodeCode Available	2
The Pile: An 800GB Dataset of Diverse Text for Language Modeling	Dec 31, 2020	DiversityLanguage Modeling	CodeCode Available	2
Automatically Identifying Words That Can Serve as Labels for Few-Shot Text Classification	Oct 26, 2020	Few-Shot Text ClassificationGeneral Classification	CodeCode Available	2
AdaBelief Optimizer: Adapting Stepsizes by the Belief in Observed Gradients	Oct 15, 2020	image-classificationImage Classification	CodeCode Available	2
Mirostat: A Neural Text Decoding Algorithm that Directly Controls Perplexity	Jul 29, 2020	Language ModelingLanguage Modelling	CodeCode Available	2
Simplifying Paragraph-level Question Generation via Transformer Language Models	May 3, 2020	Language ModelingLanguage Modelling	CodeCode Available	2
MPNet: Masked and Permuted Pre-training for Language Understanding	Apr 20, 2020	Language ModelingLanguage Modelling	CodeCode Available	2
BAE: BERT-based Adversarial Examples for Text Classification	Apr 4, 2020	Adversarial AttackAdversarial Text	CodeCode Available	2
Self-Supervised Log Parsing	Mar 17, 2020	Anomaly DetectionFault Detection	CodeCode Available	2
CLUECorpus2020: A Large-scale Chinese Corpus for Pre-training Language Model	Mar 3, 2020	8kLanguage Modeling	CodeCode Available	2
Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism	Sep 17, 2019	GPULAMBADA	CodeCode Available	2
MASS: Masked Sequence to Sequence Pre-training for Language Generation	May 7, 2019	Conversational Response GenerationDecoder	CodeCode Available	2
Knowledge Representation Learning: A Quantitative Review	Dec 28, 2018	General ClassificationInformation Retrieval	CodeCode Available	2
Training RNNs as Fast as CNNs	Jan 1, 2018	General ClassificationLanguage Modeling	CodeCode Available	2
Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer	Jan 23, 2017	Computational EfficiencyGPU	CodeCode Available	2
End-To-End Memory Networks	Mar 31, 2015	Language ModelingLanguage Modelling	CodeCode Available	2
InstructFLIP: Exploring Unified Vision-Language Model for Face Anti-spoofing	Jul 16, 2025	Domain GeneralizationFace Anti-Spoofing	CodeCode Available	1
Describe Anything Model for Visual Question Answering on Text-rich Images	Jul 16, 2025	DescriptiveLanguage Modeling	CodeCode Available	1
Evaluating Morphological Alignment of Tokenizers in 70 Languages	Jul 8, 2025	Language ModelingLanguage Modelling	CodeCode Available	1
Differential Mamba	Jul 8, 2025	Language ModelingLanguage Modelling	CodeCode Available	1

Show:10 25 50

← PrevPage 42 of 568Next →

No leaderboard results yet.