Language Modeling

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–450 of 14182 papers

Title	Date	Tasks	Status	Hype
Reasoning with Language Model Prompting: A Survey	Dec 19, 2022	Arithmetic ReasoningCommon Sense Reasoning	CodeCode Available	3
Discovering Language Model Behaviors with Model-Written Evaluations	Dec 19, 2022	Language ModelingLanguage Modelling	CodeCode Available	3
Prompting Is Programming: A Query Language for Large Language Models	Dec 12, 2022	Code GenerationLanguage Modeling	CodeCode Available	3
Human-level play in the game of Diplomacy by combining language models with strategic reasoning	Nov 22, 2022	AI AgentLanguage Modeling	CodeCode Available	3
What Language Model to Train if You Have One Million GPU Hours?	Oct 27, 2022	GPULanguage Modeling	CodeCode Available	3
Diffusion-LM Improves Controllable Text Generation	May 27, 2022	Language ModelingLanguage Modelling	CodeCode Available	3
A Systematic Evaluation of Large Language Models of Code	Feb 26, 2022	Language ModelingLanguage Modelling	CodeCode Available	3
Using DeepSpeed and Megatron to Train Megatron-Turing NLG 530B, A Large-Scale Generative Language Model	Jan 28, 2022	Few-Shot LearningLanguage Modeling	CodeCode Available	3
Datasheet for the Pile	Jan 13, 2022	Language ModelingLanguage Modelling	CodeCode Available	3
8-bit Optimizers via Block-wise Quantization	Oct 6, 2021	Language ModelingLanguage Modelling	CodeCode Available	3
Finetuned Language Models Are Zero-Shot Learners	Sep 3, 2021	ARCCommon Sense Reasoning	CodeCode Available	3
W2v-BERT: Combining Contrastive Learning and Masked Language Modeling for Self-Supervised Speech Pre-Training	Aug 7, 2021	Contrastive LearningLanguage Modeling	CodeCode Available	3
Evaluating Large Language Models Trained on Code	Jul 7, 2021	Code GenerationHumanEval	CodeCode Available	3
Multi-objective Asynchronous Successive Halving	Jun 23, 2021	FairnessHyperparameter Optimization	CodeCode Available	3
GLM: General Language Model Pretraining with Autoregressive Blank Infilling	Mar 18, 2021	Abstractive Text SummarizationClassification	CodeCode Available	3
Prefix-Tuning: Optimizing Continuous Prompts for Generation	Jan 1, 2021	Language ModelingLanguage Modelling	CodeCode Available	3
PGL at TextGraphs 2020 Shared Task: Explanation Regeneration using Language and Graph Learning Methods	Dec 1, 2020	Graph LearningLanguage Modeling	CodeCode Available	3
ERNIE-Gram: Pre-Training with Explicitly N-Gram Masked Language Modeling for Natural Language Understanding	Oct 23, 2020	Language ModelingLanguage Modelling	CodeCode Available	3
Language Models are Few-Shot Learners	May 28, 2020	answerability predictionArticles	CodeCode Available	3
Conformer: Convolution-augmented Transformer for Speech Recognition	May 16, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	3
Revisiting Pre-Trained Models for Chinese Natural Language Processing	Apr 29, 2020	Language ModelingLanguage Modelling	CodeCode Available	3
Longformer: The Long-Document Transformer	Apr 10, 2020	DecoderLanguage Modeling	CodeCode Available	3
Semi-Supervised Speech Recognition via Local Prior Matching	Feb 24, 2020	Knowledge DistillationLanguage Modeling	CodeCode Available	3
Universal Language Model Fine-tuning for Text Classification	Jan 18, 2018	General ClassificationLanguage Modeling	CodeCode Available	3
Order Matters: Sequence to sequence for sets	Nov 19, 2015	Language Modeling	CodeCode Available	3
Open Source Planning & Control System with Language Agents for Autonomous Scientific Discovery	Jul 9, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
DeSTA2.5-Audio: Toward General-Purpose Large Audio Language Model with Self-Generated Cross-Modal Alignment	Jul 3, 2025	cross-modal alignmentInstruction Following	CodeCode Available	2
OctoThinker: Mid-training Incentivizes Reinforcement Learning Scaling	Jun 25, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
Language Modeling by Language Models	Jun 25, 2025	Code GenerationLanguage Modeling	CodeCode Available	2
Pre-Trained LLM is a Semantic-Aware and Generalizable Segmentation Booster	Jun 22, 2025	DecoderImage Segmentation	CodeCode Available	2
Watermarking Autoregressive Image Generation	Jun 19, 2025	Image GenerationLanguage Modeling	CodeCode Available	2
BMFM-RNA: An Open Framework for Building and Evaluating Transcriptomic Foundation Models	Jun 17, 2025	BenchmarkingLanguage Modeling	CodeCode Available	2
Reasoning-Table: Exploring Reinforcement Learning for Table Reasoning	Jun 2, 2025	Fact VerificationLanguage Modeling	CodeCode Available	2
MagiCodec: Simple Masked Gaussian-Injected Codec for High-Fidelity Reconstruction and Generation	May 31, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
GeoVision Labeler: Zero-Shot Geospatial Classification with Vision and Language Models	May 30, 2025	ClassificationDisaster Response	CodeCode Available	2
ReasonGen-R1: CoT for Autoregressive Image generation models through SFT and RL	May 30, 2025	Image GenerationLanguage Modeling	CodeCode Available	2
Zero-Shot Vision Encoder Grafting via LLM Surrogates	May 28, 2025	DecoderLanguage Modeling	CodeCode Available	2
Improved Representation Steering for Language Models	May 27, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
LLaMEA-BO: A Large Language Model Evolutionary Algorithm for Automatically Generating Bayesian Optimization Algorithms	May 27, 2025	Bayesian OptimizationBenchmarking	CodeCode Available	2
WINA: Weight Informed Neuron Activation for Accelerating Large Language Model Inference	May 26, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
DanmakuTPPBench: A Multi-modal Benchmark for Temporal Point Process Modeling and Understanding	May 23, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
Dimple: Discrete Diffusion Multimodal Large Language Model with Parallel Decoding	May 22, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
Structure-Aligned Protein Language Model	May 22, 2025	Contrastive LearningLanguage Modeling	CodeCode Available	2
CAD-Coder: An Open-Source Vision-Language Model for Computer-Aided Design Code Generation	May 20, 2025	Code GenerationLanguage Modeling	CodeCode Available	2
Efficient Speech Language Modeling via Energy Distance in Continuous Latent Space	May 19, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
G1: Bootstrapping Perception and Reasoning Abilities of Vision-Language Model via Reinforcement Learning	May 19, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
SLOT: Sample-specific Language Model Optimization at Test-time	May 18, 2025	GSM8KLanguage Modeling	CodeCode Available	2
Demystifying and Enhancing the Efficiency of Large Language Model Based Search Agents	May 17, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
LifelongAgentBench: Evaluating LLM Agents as Lifelong Learners	May 17, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
WorldPM: Scaling Human Preference Modeling	May 15, 2025	Language ModelingLanguage Modelling	CodeCode Available	2

Show:10 25 50

← PrevPage 9 of 284Next →

No leaderboard results yet.