Large Language Model

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 6097 papers

Title	Date	Tasks	Status	Hype
Baize: An Open-Source Chat Model with Parameter-Efficient Tuning on Self-Chat Data	Apr 3, 2023	ChatbotLanguage Modeling	CodeCode Available	4
ChatDoctor: A Medical Chat Model Fine-Tuned on a Large Language Model Meta-AI (LLaMA) Using Medical Domain Knowledge	Mar 24, 2023	Information RetrievalLanguage Modeling	CodeCode Available	4
Cost-Effective Hyperparameter Optimization for Large Language Model Generation Inference	Mar 8, 2023	Hyperparameter OptimizationLanguage Modeling	CodeCode Available	4
Galactica: A Large Language Model for Science	Nov 16, 2022	AnachronismsBias Detection	CodeCode Available	4
Fast Transformer Decoding: One Write-Head is All You Need	Nov 6, 2019	AllLanguage Modelling	CodeCode Available	4
ShareGPT-4o-Image: Aligning Multimodal Models with GPT-4o-Level Image Generation	Jun 22, 2025	GPUImage Generation	CodeCode Available	3
FlexRAG: A Flexible and Comprehensive Framework for Retrieval-Augmented Generation	Jun 14, 2025	Language ModelingLanguage Modelling	CodeCode Available	3
G-Memory: Tracing Hierarchical Memory for Multi-Agent Systems	Jun 9, 2025	Large Language Model	CodeCode Available	3
A Smart Multimodal Healthcare Copilot with Powerful LLM Reasoning	Jun 3, 2025	Decision MakingDiagnostic	CodeCode Available	3
BioReason: Incentivizing Multimodal Biological Reasoning within a DNA-LLM Model	May 29, 2025	Large Language Modelscientific discovery	CodeCode Available	3
Sentient Agent as a Judge: Evaluating Higher-Order Social Cognition in Large Language Models	May 1, 2025	Large Language Model	CodeCode Available	3
Kimina-Prover Preview: Towards Large Formal Reasoning Models with Reinforcement Learning	Apr 15, 2025	Automated Theorem ProvingLarge Language Model	CodeCode Available	3
Evaluation Report on MCP Servers	Apr 15, 2025	Large Language Model	CodeCode Available	3
SWEET-RL: Training Multi-Turn LLM Agents on Collaborative Reasoning Tasks	Mar 19, 2025	Language ModelingLanguage Modelling	CodeCode Available	3
A Survey on the Optimization of Large Language Model-based Agents	Mar 16, 2025	Decision MakingLanguage Modeling	CodeCode Available	3
SVD-LLM V2: Optimizing Singular Value Truncation for Large Language Model Compression	Mar 16, 2025	Language ModelingLanguage Modelling	CodeCode Available	3
GoT: Unleashing Reasoning Capability of Multimodal Large Language Model for Visual Generation and Editing	Mar 13, 2025	Image GenerationLanguage Modeling	CodeCode Available	3
Parallelized Planning-Acting for Efficient LLM-based Multi-Agent Systems	Mar 5, 2025	Decision MakingLanguage Modeling	CodeCode Available	3
AsymLoRA: Harmonizing Data Conflicts and Commonalities in MLLMs	Feb 27, 2025	Language ModelingLanguage Modelling	CodeCode Available	3
Baichuan-Audio: A Unified Framework for End-to-End Speech Interaction	Feb 24, 2025	Language ModelingLanguage Modelling	CodeCode Available	3
Prompt-to-Leaderboard	Feb 20, 2025	ChatbotLanguage Modeling	CodeCode Available	3
Agentic Deep Graph Reasoning Yields Self-Organizing Knowledge Networks	Feb 18, 2025	graph constructionLarge Language Model	CodeCode Available	3
Goedel-Prover: A Frontier Model for Open-Source Automated Theorem Proving	Feb 11, 2025	Automated Theorem ProvingLarge Language Model	CodeCode Available	3
Multi-agent Architecture Search via Agentic Supernet	Feb 6, 2025	Language ModelingLanguage Modelling	CodeCode Available	3
MedRAG: Enhancing Retrieval-augmented Generation with Knowledge Graph-Elicited Reasoning for Healthcare Copilot	Feb 6, 2025	DiagnosticLarge Language Model	CodeCode Available	3
Partially Rewriting a Transformer in Natural Language	Jan 31, 2025	Language ModelingLanguage Modelling	CodeCode Available	3
HERMES: A Unified Self-Driving World Model for Simultaneous 3D Scene Understanding and Generation	Jan 24, 2025	Autonomous DrivingLanguage Modeling	CodeCode Available	3
VARGPT: Unified Understanding and Generation in a Visual Autoregressive Multimodal Large Language Model	Jan 21, 2025	Image GenerationInstruction Following	CodeCode Available	3
Lifelong Learning of Large Language Model based Agents: A Roadmap	Jan 13, 2025	Incremental LearningLanguage Modeling	CodeCode Available	3
Valley2: Exploring Multimodal Models with Scalable Vision-Language Design	Jan 10, 2025	Image CaptioningLanguage Modeling	CodeCode Available	3
LangFair: A Python Package for Assessing Bias and Fairness in Large Language Model Use Cases	Jan 6, 2025	FairnessLanguage Modeling	CodeCode Available	3
A Survey on Large Language Model Acceleration based on KV Cache Management	Dec 27, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
DARWIN 1.5: Large Language Models as Materials Science Adapted Learners	Dec 16, 2024	Large Language ModelMulti-Task Learning	CodeCode Available	3
ATPrompt: Textual Prompt Learning with Embedded Attributes	Dec 12, 2024	AttributeLarge Language Model	CodeCode Available	3
From Individual to Society: A Survey on Social Simulation Driven by Large Language Model-based Agents	Dec 4, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
HackSynth: LLM Agent and Evaluation Framework for Autonomous Penetration Testing	Dec 2, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
Large Language Model-Brained GUI Agents: A Survey	Nov 27, 2024	Code GenerationLanguage Modeling	CodeCode Available	3
Pushing the Limits of Large Language Model Quantization via the Linearity Theorem	Nov 26, 2024	GPULanguage Modeling	CodeCode Available	3
BayLing 2: A Multilingual Large Language Model with Efficient Language Alignment	Nov 25, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
SemiKong: Curating, Training, and Evaluating A Semiconductor Industry-Specific Large Language Model	Nov 21, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
SuffixDecoding: Extreme Speculative Decoding for Emerging AI Applications	Nov 7, 2024	Code GenerationLanguage Modeling	CodeCode Available	3
COAT: Compressing Optimizer states and Activation for Memory-Efficient FP8 Training	Oct 25, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
LongMemEval: Benchmarking Chat Assistants on Long-Term Interactive Memory	Oct 14, 2024	BenchmarkingLarge Language Model	CodeCode Available	3
Baichuan-Omni Technical Report	Oct 11, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
Towards Next-Generation LLM-based Recommender Systems: A Survey and Beyond	Oct 10, 2024	Large Language ModelRecommendation Systems	CodeCode Available	3
LayerKV: Optimizing Large Language Model Serving with Layer-wise KV Cache Management	Oct 1, 2024	GPULanguage Modeling	CodeCode Available	3
Programming Every Example: Lifting Pre-training Data Quality like Experts at Scale	Sep 25, 2024	Large Language Model	CodeCode Available	3
LLMServingSim: A HW/SW Co-Simulation Infrastructure for LLM Inference Serving at Scale	Aug 10, 2024	GPULanguage Modelling	CodeCode Available	3
OptiMUS-0.3: Using Large Language Models to Model and Solve Optimization Problems at Scale	Jul 29, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
Odyssey: Empowering Minecraft Agents with Open-World Skills	Jul 22, 2024	Language ModellingLarge Language Model	CodeCode Available	3

Show:10 25 50

← PrevPage 4 of 122Next →

No leaderboard results yet.