Large Language Model

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 6097 papers

Title	Date	Tasks	Status	Hype	Score
CAMEL: Communicative Agents for "Mind" Exploration of Large Language Model Society	Mar 31, 2023	Instruction FollowingLanguage Modeling	CodeCode Available	6	5
FinGPT: Open-Source Financial Large Language Models	Jun 9, 2023	Algorithmic TradingLanguage Modeling	CodeCode Available	6	5
Large Multilingual Models Pivot Zero-Shot Multimodal Learning across Languages	Aug 23, 2023	Image GenerationImage to text	CodeCode Available	6	5
Efficient Memory Management for Large Language Model Serving with PagedAttention	Sep 12, 2023	Language ModelingLanguage Modelling	CodeCode Available	6	5
Qwen Technical Report	Sep 28, 2023	Language ModelingLanguage Modelling	CodeCode Available	6	5
CodeGen: An Open Large Language Model for Code with Multi-Turn Program Synthesis	Mar 25, 2022	Code GenerationHumanEval	CodeCode Available	6	5
MiMo: Unlocking the Reasoning Potential of Language Model -- From Pretraining to Posttraining	May 12, 2025	Language ModelingLanguage Modelling	CodeCode Available	5	5
MING-MOE: Enhancing Medical Multi-Task Learning in Large Language Models with Sparse Mixture of Low-Rank Adapter Experts	Apr 13, 2024	DiversityLanguage Modeling	CodeCode Available	5	5
MegaScale: Scaling Large Language Model Training to More Than 10,000 GPUs	Feb 23, 2024	Language ModelingLanguage Modelling	CodeCode Available	5	5
Generating Physically Stable and Buildable LEGO Designs from Text	May 8, 2025	3D GenerationLarge Language Model	CodeCode Available	5	5
Chatlaw: A Multi-Agent Collaborative Legal Assistant with Knowledge Graph Enhanced Mixture-of-Experts Large Language Model	Jun 28, 2023	HallucinationKnowledge Graphs	CodeCode Available	5	5
FlexLLM: A System for Co-Serving Large Language Model Inference and Parameter-Efficient Finetuning	Feb 29, 2024	GPULanguage Modeling	CodeCode Available	5	5
Mastering Text-to-Image Diffusion: Recaptioning, Planning, and Generating with Multimodal LLMs	Jan 22, 2024	Diffusion Personalization Tuning FreeImage Generation	CodeCode Available	5	5
CacheGen: KV Cache Compression and Streaming for Fast Large Language Model Serving	Oct 11, 2023	Language ModelingLanguage Modelling	CodeCode Available	5	5
FireRedASR: Open-Source Industrial-Grade Mandarin Speech Recognition Models from Encoder-Decoder to LLM Integration	Jan 24, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5	5
Weakly Supervised Detection of Hallucinations in LLM Activations	Dec 5, 2023	HallucinationLanguage Modeling	CodeCode Available	5	5
Executable Code Actions Elicit Better LLM Agents	Feb 1, 2024	Language ModellingLarge Language Model	CodeCode Available	5	5
Exploring Large Language Model based Intelligent Agents: Definitions, Methods, and Prospects	Jan 7, 2024	Language ModelingLanguage Modelling	CodeCode Available	5	5
Ferret: Refer and Ground Anything Anywhere at Any Granularity	Oct 11, 2023	HallucinationLanguage Modeling	CodeCode Available	5	5
WorkArena: How Capable Are Web Agents at Solving Common Knowledge Work Tasks?	Mar 12, 2024	Language ModelingLanguage Modelling	CodeCode Available	5	5
4th PVUW MeViS 3rd Place Report: Sa2VA	Apr 1, 2025	Language ModelingLanguage Modelling	CodeCode Available	5	5
Stream-Omni: Simultaneous Multimodal Interactions with Large Language-Vision-Speech Model	Jun 16, 2025	Large Language Modelmultimodal interaction	CodeCode Available	5	5
StarVector: Generating Scalable Vector Graphics Code from Images and Text	Dec 17, 2023	Code GenerationLanguage Modeling	CodeCode Available	5	5
The Rise and Potential of Large Language Model Based Agents: A Survey	Sep 14, 2023	Language ModelingLanguage Modelling	CodeCode Available	5	5
AgentCPM-GUI: Building Mobile-Use Agents with Reinforcement Fine-Tuning	Jun 2, 2025	AI AgentDiversity	CodeCode Available	5	5
InspireMusic: Integrating Super Resolution and Large Language Model for High-Fidelity Long-Form Music Generation	Feb 28, 2025	Audio GenerationForm	CodeCode Available	5	5
ThinkSound: Chain-of-Thought Reasoning in Multimodal Large Language Models for Audio Generation and Editing	Jun 26, 2025	Audio GenerationLarge Language Model	CodeCode Available	5	5
R1-Omni: Explainable Omni-Multimodal Emotion Recognition with Reinforcement Learning	Mar 7, 2025	Emotion RecognitionLanguage Modeling	CodeCode Available	5	5
Retrieval-Augmented Generation for AI-Generated Content: A Survey	Feb 29, 2024	Information RetrievalLarge Language Model	CodeCode Available	5	5
DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models	Jan 11, 2024	Language ModellingLarge Language Model	CodeCode Available	5	5
DeepSeek-Prover-V2: Advancing Formal Mathematical Reasoning via Reinforcement Learning for Subgoal Decomposition	Apr 30, 2025	Automated Theorem ProvingLarge Language Model	CodeCode Available	5	5
RLHF Workflow: From Reward Modeling to Online RLHF	May 13, 2024	ChatbotHumanEval	CodeCode Available	5	5
Unlocking Efficiency in Large Language Model Inference: A Comprehensive Survey of Speculative Decoding	Jan 15, 2024	Language ModelingLanguage Modelling	CodeCode Available	5	5
LAB: Large-Scale Alignment for ChatBots	Mar 2, 2024	Instruction FollowingLanguage Modeling	CodeCode Available	5	5
Datasets for Large Language Models: A Comprehensive Survey	Feb 28, 2024	Language ModellingLarge Language Model	CodeCode Available	5	5
NotaGen: Advancing Musicality in Symbolic Music Generation with Large Language Model Training Paradigms	Feb 25, 2025	Language ModelingLanguage Modelling	CodeCode Available	5	5
GRUtopia: Dream General Robots in a City at Scale	Jul 15, 2024	Language ModellingLarge Language Model	CodeCode Available	5	5
FlexGen: High-Throughput Generative Inference of Large Language Models with a Single GPU	Mar 13, 2023	CPUGPU	CodeCode Available	5	5
Large Language Model based Multi-Agents: A Survey of Progress and Challenges	Jan 21, 2024	Decision MakingLanguage Modeling	CodeCode Available	5	5
MEIA: Multimodal Embodied Perception and Interaction in Unknown Environments	Feb 1, 2024	Embodied Question AnsweringLanguage Modeling	CodeCode Available	5	5
ELLA: Equip Diffusion Models with LLM for Enhanced Semantic Alignment	Mar 8, 2024	DenoisingImage Generation	CodeCode Available	5	5
PowerInfer: Fast Large Language Model Serving with a Consumer-grade GPU	Dec 16, 2023	CPUGPU	CodeCode Available	5	5
VisionLLM v2: An End-to-End Generalist Multimodal Large Language Model for Hundreds of Vision-Language Tasks	Jun 12, 2024	Image GenerationLanguage Modeling	CodeCode Available	5	5
ChatDoctor: A Medical Chat Model Fine-Tuned on a Large Language Model Meta-AI (LLaMA) Using Medical Domain Knowledge	Mar 24, 2023	Information RetrievalLanguage Modeling	CodeCode Available	4	5
G-LLaVA: Solving Geometric Problem with Multi-Modal Large Language Model	Dec 18, 2023	Language ModelingLanguage Modelling	CodeCode Available	4	5
ChatHaruhi: Reviving Anime Character in Reality via Large Language Model	Aug 18, 2023	Language ModelingLanguage Modelling	CodeCode Available	4	5
Generative Representational Instruction Tuning	Feb 15, 2024	Language ModelingLanguage Modelling	CodeCode Available	4	5
Galactica: A Large Language Model for Science	Nov 16, 2022	AnachronismsBias Detection	CodeCode Available	4	5
Medical Graph RAG: Towards Safe Medical Large Language Model via Graph Retrieval-Augmented Generation	Aug 8, 2024	ChunkingFact Checking	CodeCode Available	4	5
FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects	Dec 13, 2023	3D Object Detection3D Object Tracking	CodeCode Available	4	5

Show:10 25 50

← PrevPage 2 of 122Next →

No leaderboard results yet.