Language Modeling

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 14182 papers

Title	Date	Tasks	Status	Hype	Score
MING-MOE: Enhancing Medical Multi-Task Learning in Large Language Models with Sparse Mixture of Low-Rank Adapter Experts	Apr 13, 2024	DiversityLanguage Modeling	CodeCode Available	5	5
MegaScale: Scaling Large Language Model Training to More Than 10,000 GPUs	Feb 23, 2024	Language ModelingLanguage Modelling	CodeCode Available	5	5
MiMo: Unlocking the Reasoning Potential of Language Model -- From Pretraining to Posttraining	May 12, 2025	Language ModelingLanguage Modelling	CodeCode Available	5	5
Weakly Supervised Detection of Hallucinations in LLM Activations	Dec 5, 2023	HallucinationLanguage Modeling	CodeCode Available	5	5
Efficient Streaming Language Models with Attention Sinks	Sep 29, 2023	Language ModelingLanguage Modelling	CodeCode Available	5	5
VisionLLM v2: An End-to-End Generalist Multimodal Large Language Model for Hundreds of Vision-Language Tasks	Jun 12, 2024	Image GenerationLanguage Modeling	CodeCode Available	5	5
MarS: a Financial Market Simulation Engine Powered by Generative Foundation Model	Sep 4, 2024	Language ModelingLanguage Modelling	CodeCode Available	5	5
Unlocking Efficiency in Large Language Model Inference: A Comprehensive Survey of Speculative Decoding	Jan 15, 2024	Language ModelingLanguage Modelling	CodeCode Available	5	5
Trajectory Prediction Meets Large Language Models: A Survey	Jun 3, 2025	Language ModelingLanguage Modelling	CodeCode Available	5	5
Fast Inference from Transformers via Speculative Decoding	Nov 30, 2022	Language ModelingLanguage Modelling	CodeCode Available	5	5
WorkArena: How Capable Are Web Agents at Solving Common Knowledge Work Tasks?	Mar 12, 2024	Language ModelingLanguage Modelling	CodeCode Available	5	5
StarVector: Generating Scalable Vector Graphics Code from Images and Text	Dec 17, 2023	Code GenerationLanguage Modeling	CodeCode Available	5	5
Dolma: an Open Corpus of Three Trillion Tokens for Language Model Pretraining Research	Jan 31, 2024	Language ModelingLanguage Modelling	CodeCode Available	5	5
SpeechAlign: Aligning Speech Generation to Human Preferences	Apr 8, 2024	Language ModelingLanguage Modelling	CodeCode Available	5	5
DeTikZify: Synthesizing Graphics Programs for Scientific Figures and Sketches with TikZ	May 24, 2024	Language ModelingLanguage Modelling	CodeCode Available	5	5
DeepSpeed-VisualChat: Multi-Round Multi-Image Interleave Chat via Multi-Modal Causal Attention	Sep 25, 2023	Language ModelingLanguage Modelling	CodeCode Available	5	5
InspireMusic: Integrating Super Resolution and Large Language Model for High-Fidelity Long-Form Music Generation	Feb 28, 2025	Audio GenerationForm	CodeCode Available	5	5
Audio Flamingo: A Novel Audio Language Model with Few-Shot Learning and Dialogue Abilities	Feb 2, 2024	Acoustic Scene ClassificationAudio captioning	CodeCode Available	5	5
Speak Foreign Languages with Your Own Voice: Cross-Lingual Neural Codec Language Modeling	Mar 7, 2023	In-Context LearningLanguage Modeling	CodeCode Available	5	5
CacheGen: KV Cache Compression and Streaming for Fast Large Language Model Serving	Oct 11, 2023	Language ModelingLanguage Modelling	CodeCode Available	5	5
LAB: Large-Scale Alignment for ChatBots	Mar 2, 2024	Instruction FollowingLanguage Modeling	CodeCode Available	5	5
Sa2VA: Marrying SAM2 with LLaVA for Dense Grounded Understanding of Images and Videos	Jan 7, 2025	2kLanguage Modeling	CodeCode Available	5	5
Interpretable Preferences via Multi-Objective Reward Modeling and Mixture-of-Experts	Jun 18, 2024	Language ModelingLanguage Modelling	CodeCode Available	5	5
KBLaM: Knowledge Base augmented Language Model	Oct 14, 2024	8kGPU	CodeCode Available	5	5
Rethinking LLM Language Adaptation: A Case Study on Chinese Mixtral	Mar 4, 2024	Language ModelingLanguage Modelling	CodeCode Available	5	5
Qwen-VL: A Versatile Vision-Language Model for Understanding, Localization, Text Reading, and Beyond	Aug 24, 2023	Chart Question AnsweringFS-MEVQA	CodeCode Available	5	5
R1-Omni: Explainable Omni-Multimodal Emotion Recognition with Reinforcement Learning	Mar 7, 2025	Emotion RecognitionLanguage Modeling	CodeCode Available	5	5
Large Language Model based Multi-Agents: A Survey of Progress and Challenges	Jan 21, 2024	Decision MakingLanguage Modeling	CodeCode Available	5	5
Randomized Autoregressive Visual Generation	Nov 1, 2024	Image GenerationLanguage Modeling	CodeCode Available	5	5
CogAgent: A Visual Language Model for GUI Agents	Dec 14, 2023	Language Modeling	CodeCode Available	5	5
CogVLM: Visual Expert for Pretrained Language Models	Nov 6, 2023	1 Image, 2*2 StitchingFS-MEVQA	CodeCode Available	5	5
PowerInfer: Fast Large Language Model Serving with a Consumer-grade GPU	Dec 16, 2023	CPUGPU	CodeCode Available	5	5
HealthGPT: A Medical Large Vision-Language Model for Unifying Comprehension and Generation via Heterogeneous Knowledge Adaptation	Feb 14, 2025	Language ModelingLanguage Modelling	CodeCode Available	5	5
4th PVUW MeViS 3rd Place Report: Sa2VA	Apr 1, 2025	Language ModelingLanguage Modelling	CodeCode Available	5	5
Assessing Language Model Deployment with Risk Cards	Mar 31, 2023	Language ModelingLanguage Modelling	CodeCode Available	5	5
Prometheus 2: An Open Source Language Model Specialized in Evaluating Other Language Models	May 2, 2024	Language ModelingLanguage Modelling	CodeCode Available	5	5
Ovis: Structural Embedding Alignment for Multimodal Large Language Model	May 31, 2024	Language ModelingMultimodal Large Language Model	CodeCode Available	5	5
Chatlaw: A Multi-Agent Collaborative Legal Assistant with Knowledge Graph Enhanced Mixture-of-Experts Large Language Model	Jun 28, 2023	HallucinationKnowledge Graphs	CodeCode Available	5	5
Improving Text-To-Audio Models with Synthetic Captions	Jun 18, 2024	AudioCapsAudio captioning	CodeCode Available	5	5
Show-o2: Improved Native Unified Multimodal Models	Jun 18, 2025	Language ModelingLanguage Modelling	CodeCode Available	5	5
Codec-SUPERB @ SLT 2024: A lightweight benchmark for neural audio codec models	Sep 21, 2024	Language ModelingLanguage Modelling	CodeCode Available	5	5
CodeGen2: Lessons for Training LLMs on Programming and Natural Languages	May 3, 2023	Causal Language ModelingDecoder	CodeCode Available	5	5
The Rise and Potential of Large Language Model Based Agents: A Survey	Sep 14, 2023	Language ModelingLanguage Modelling	CodeCode Available	5	5
N-Grammer: Augmenting Transformers with latent n-grams	Jul 13, 2022	Common Sense ReasoningCoreference Resolution	CodeCode Available	4	5
Can Machines Help Us Answering Question 16 in Datasheets, and In Turn Reflecting on Inappropriate Content?	Feb 14, 2022	Language ModelingLanguage Modelling	CodeCode Available	4	5
Galactica: A Large Language Model for Science	Nov 16, 2022	AnachronismsBias Detection	CodeCode Available	4	5
FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects	Dec 13, 2023	3D Object Detection3D Object Tracking	CodeCode Available	4	5
Gated Delta Networks: Improving Mamba2 with Delta Rule	Dec 9, 2024	Common Sense ReasoningLanguage Modeling	CodeCode Available	4	5
Fin-R1: A Large Language Model for Financial Reasoning through Reinforcement Learning	Mar 20, 2025	Decision MakingLanguage Modeling	CodeCode Available	4	5
Flamingo: a Visual Language Model for Few-Shot Learning	Apr 29, 2022	Few-Shot LearningGenerative Visual Question Answering	CodeCode Available	4	5

Show:10 25 50

← PrevPage 3 of 284Next →

No leaderboard results yet.