Large Language Model

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 6097 papers

Title	Date	Tasks	Status	Hype
Relevance Isn't All You Need: Scaling RAG Systems With Inference-Time Compute Via Multi-Criteria Reranking	Mar 14, 2025	AllLarge Language Model	CodeCode Available	14
Autonomous Agents for Collaborative Task under Information Asymmetry	Jun 21, 2024	Language ModellingLarge Language Model	CodeCode Available	14
Zep: A Temporal Knowledge Graph Architecture for Agent Memory	Jan 20, 2025	Large Language ModelRAG	CodeCode Available	12
OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation	May 29, 2025	Large Language Model	CodeCode Available	11
CosyVoice 3: Towards In-the-wild Speech Generation via Scaling-up and Post-training	May 23, 2025	Automatic Speech RecognitionEmotion Recognition	CodeCode Available	11
IndexTTS: An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System	Feb 8, 2025	DecoderLanguage Modeling	CodeCode Available	11
JanusFlow: Harmonizing Autoregression and Rectified Flow for Unified Multimodal Understanding and Generation	Nov 12, 2024	Language ModelingLanguage Modelling	CodeCode Available	11
HybridFlow: A Flexible and Efficient RLHF Framework	Sep 28, 2024	Large Language Model	CodeCode Available	11
CosyVoice: A Scalable Multilingual Zero-shot Text-to-speech Synthesizer based on Supervised Semantic Tokens	Jul 7, 2024	Language ModellingLarge Language Model	CodeCode Available	11
Scaling Synthetic Data Creation with 1,000,000,000 Personas	Jun 28, 2024	Language ModelingLanguage Modelling	CodeCode Available	11
DeepSeek-Coder: When the Large Language Model Meets Programming -- The Rise of Code Intelligence	Jan 25, 2024	Code GenerationLanguage Modeling	CodeCode Available	11
MiniCPM4: Ultra-Efficient LLMs on End Devices	Jun 9, 2025	Large Language Model	CodeCode Available	9
SkyReels-V2: Infinite-length Film Generative Model	Apr 17, 2025	Large Language Modelmodel	CodeCode Available	9
AutoAgent: A Fully-Automated and Zero-Code Framework for LLM Agents	Feb 9, 2025	Large Language ModelRAG	CodeCode Available	9
Moshi: a speech-text foundation model for real-time dialogue	Sep 17, 2024	Action DetectionActivity Detection	CodeCode Available	9
MInference 1.0: Accelerating Pre-filling for Long-Context LLMs via Dynamic Sparse Attention	Jul 2, 2024	GPULanguage Modelling	CodeCode Available	9
PowerInfer-2: Fast Large Language Model Inference on a Smartphone	Jun 10, 2024	CPULanguage Modeling	CodeCode Available	9
LawGPT: A Chinese Legal Knowledge-Enhanced Large Language Model	Jun 7, 2024	Language ModelingLanguage Modelling	CodeCode Available	9
CacheBlend: Fast Large Language Model Serving for RAG with Cached Knowledge Fusion	May 26, 2024	Language ModelingLanguage Modelling	CodeCode Available	9
FinRobot: An Open-Source AI Agent Platform for Financial Applications using Large Language Models	May 23, 2024	AI AgentDecision Making	CodeCode Available	9
Ferret-v2: An Improved Baseline for Referring and Grounding with Large Language Models	Apr 11, 2024	Language ModelingLanguage Modelling	CodeCode Available	9
Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction	Apr 3, 2024	Image GenerationImage Reconstruction	CodeCode Available	9
LISA: Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning	Mar 26, 2024	GPUGSM8K	CodeCode Available	9
Adapting Large Language Model with Speech for Fully Formatted End-to-End Speech Recognition	Jul 17, 2023	DecoderLanguage Modeling	CodeCode Available	8
V-JEPA 2: Self-Supervised Video Models Enable Understanding, Prediction and Planning	Jun 11, 2025	Action AnticipationLarge Language Model	CodeCode Available	7
ComfyUI-Copilot: An Intelligent Assistant for Automated Workflow Development	Jun 5, 2025	Large Language Model	CodeCode Available	7
Large Language Model Agent: A Survey on Methodology, Applications and Challenges	Mar 27, 2025	Language ModelingLanguage Modelling	CodeCode Available	7
Qwen2.5-Omni Technical Report	Mar 26, 2025	Automatic Speech Recognition (ASR)GSM8K	CodeCode Available	7
LLMs Can Easily Learn to Reason from Demonstrations Structure, not content, is what matters!	Feb 11, 2025	Large Language ModelMath	CodeCode Available	7
PIKE-RAG: sPecIalized KnowledgE and Rationale Augmented Generation	Jan 20, 2025	Language ModelingLanguage Modelling	CodeCode Available	7
FastSwitch: Optimizing Context Switching Efficiency in Fairness-aware Large Language Model Serving	Nov 27, 2024	FairnessGPU	CodeCode Available	7
OASIS: Open Agent Social Interaction Simulations with One Million Agents	Nov 18, 2024	Large Language ModelRecommendation Systems	CodeCode Available	7
MagicQuill: An Intelligent Interactive Image Editing System	Nov 14, 2024	Language ModelingLanguage Modelling	CodeCode Available	7
AutoTrain: No-code training for state-of-the-art models	Oct 21, 2024	Classificationimage-classification	CodeCode Available	7
aiXcoder-7B: A Lightweight and Effective Large Language Model for Code Processing	Oct 17, 2024	AttributeCode Completion	CodeCode Available	7
mPLUG-Owl3: Towards Long Image-Sequence Understanding in Multi-Modal Large Language Models	Aug 9, 2024	Language ModelingLanguage Modelling	CodeCode Available	7
VITA: Towards Open-Source Interactive Omni Multimodal LLM	Aug 9, 2024	Language ModelingLanguage Modelling	CodeCode Available	7
Mixture-of-Agents Enhances Large Language Model Capabilities	Jun 7, 2024	Language ModelingLanguage Modelling	CodeCode Available	7
Adaptive In-conversation Team Building for Language Model Agents	May 29, 2024	DiversityLanguage Modeling	CodeCode Available	7
Hunyuan-DiT: A Powerful Multi-Resolution Diffusion Transformer with Fine-Grained Chinese Understanding	May 14, 2024	Image GenerationLanguage Modeling	CodeCode Available	7
Labeling supervised fine-tuning data with the scaling law	May 5, 2024	coreference-resolutionCoreference Resolution	CodeCode Available	7
SoftTiger: A Clinical Foundation Model for Healthcare Workflows	Mar 1, 2024	Language ModellingLarge Language Model	CodeCode Available	7
SPHINX-X: Scaling Data and Parameters for a Family of Multi-modal Large Language Models	Feb 8, 2024	BenchmarkingDiversity	CodeCode Available	7
MiniGPT-v2: large language model as a unified interface for vision-language multi-task learning	Oct 14, 2023	Image ClassificationImage Description	CodeCode Available	7
Prometheus: Inducing Fine-grained Evaluation Capability in Language Models	Oct 12, 2023	Language ModellingLarge Language Model	CodeCode Available	7
Judging LLM-as-a-Judge with MT-Bench and Chatbot Arena	Jun 9, 2023	ChatbotLanguage Modelling	CodeCode Available	7
MiniGPT-4: Enhancing Vision-Language Understanding with Advanced Large Language Models	Apr 20, 2023	Image DescriptionLanguage Modelling	CodeCode Available	7
Elixir: Train a Large Language Model on a Small GPU Cluster	Dec 10, 2022	CPUGPU	CodeCode Available	7
Qwen Technical Report	Sep 28, 2023	Language ModelingLanguage Modelling	CodeCode Available	6
Efficient Memory Management for Large Language Model Serving with PagedAttention	Sep 12, 2023	Language ModelingLanguage Modelling	CodeCode Available	6

Show:10 25 50

← PrevPage 1 of 122Next →

No leaderboard results yet.