Large Language Model

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 6097 papers

Title	Date	Tasks	Status	Hype	Score
Evolution of Heuristics: Towards Efficient Automatic Algorithm Design Using Large Language Model	Jan 4, 2024	Combinatorial OptimizationLanguage Modeling	CodeCode Available	3	5
MedRAG: Enhancing Retrieval-augmented Generation with Knowledge Graph-Elicited Reasoning for Healthcare Copilot	Feb 6, 2025	DiagnosticLarge Language Model	CodeCode Available	3	5
DriveDreamer-2: LLM-Enhanced World Models for Diverse Driving Video Generation	Mar 11, 2024	Autonomous DrivingLanguage Modeling	CodeCode Available	3	5
MeshXL: Neural Coordinate Field for Generative 3D Foundation Models	May 31, 2024	Language ModelingLanguage Modelling	CodeCode Available	3	5
LongMemEval: Benchmarking Chat Assistants on Long-Term Interactive Memory	Oct 14, 2024	BenchmarkingLarge Language Model	CodeCode Available	3	5
An Actionable Framework for Assessing Bias and Fairness in Large Language Model Use Cases	Jul 15, 2024	Attributecounterfactual	CodeCode Available	3	5
Detecting hallucinations in large language models using semantic entropy	Jun 19, 2024	Large Language ModelQuestion Answering	CodeCode Available	3	5
LLMServingSim: A HW/SW Co-Simulation Infrastructure for LLM Inference Serving at Scale	Aug 10, 2024	GPULanguage Modelling	CodeCode Available	3	5
Llemma: An Open Language Model For Mathematics	Oct 16, 2023	Arithmetic ReasoningAutomated Theorem Proving	CodeCode Available	3	5
Deep Learning and LLM-based Methods Applied to Stellar Lightcurve Classification	Apr 16, 2024	Feature EngineeringLanguage Modeling	CodeCode Available	3	5
AnyTool: Self-Reflective, Hierarchical Agents for Large-Scale API Calls	Feb 6, 2024	Language ModelingLanguage Modelling	CodeCode Available	3	5
Enhancing Decision Analysis with a Large Language Model: pyDecision a Comprehensive Library of MCDA Methods in Python	Apr 9, 2024	Decision MakingLanguage Modeling	CodeCode Available	3	5
DARWIN 1.5: Large Language Models as Materials Science Adapted Learners	Dec 16, 2024	Large Language ModelMulti-Task Learning	CodeCode Available	3	5
LHRS-Bot-Nova: Improved Multimodal Large Language Model for Remote Sensing Vision-Language Interpretation	Nov 14, 2024	Earth ObservationInstruction Following	CodeCode Available	2	5
Cross-Tokenizer Distillation via Approximate Likelihood Matching	Mar 25, 2025	Large Language Model	CodeCode Available	2	5
Libra: Building Decoupled Vision System on Large Language Models	May 16, 2024	Image to textLanguage Modeling	CodeCode Available	2	5
Customization Assistant for Text-to-image Generation	Dec 5, 2023	DescriptiveImage Generation	CodeCode Available	2	5
Can Large Language Model Agents Simulate Human Trust Behavior?	Feb 7, 2024	Language ModelingLanguage Modelling	CodeCode Available	2	5
LifeGPT: Topology-Agnostic Generative Pretrained Transformer Model for Cellular Automata	Sep 3, 2024	Large Language Model	CodeCode Available	2	5
CritiqueLLM: Towards an Informative Critique Generation Model for Evaluation of Large Language Model Generation	Nov 30, 2023	Language ModelingLanguage Modelling	CodeCode Available	2	5
CVE-Bench: A Benchmark for AI Agents' Ability to Exploit Real-World Web Application Vulnerabilities	Mar 21, 2025	Language ModelingLanguage Modelling	CodeCode Available	2	5
Critique-out-Loud Reward Models	Aug 21, 2024	Language ModellingLarge Language Model	CodeCode Available	2	5
Learning What Reinforcement Learning Can't: Interleaved Online Fine-Tuning for Hardest Questions	Jun 9, 2025	Large Language ModelReinforcement Learning (RL)	CodeCode Available	2	5
LifelongAgentBench: Evaluating LLM Agents as Lifelong Learners	May 17, 2025	Language ModelingLanguage Modelling	CodeCode Available	2	5
CrackSQL: A Hybrid SQL Dialect Translation System Powered by Large Language Models	Apr 1, 2025	Large Language ModelTranslation	CodeCode Available	2	5
Large Scale Transfer Learning for Tabular Data via Language Modeling	Jun 17, 2024	Language ModelingLanguage Modelling	CodeCode Available	2	5
L-AutoDA: Leveraging Large Language Models for Automated Decision-based Adversarial Attacks	Jan 27, 2024	Adversarial AttackComputational Efficiency	CodeCode Available	2	5
LaVy: Vietnamese Multimodal Large Language Model	Apr 11, 2024	Language ModelingLanguage Modelling	CodeCode Available	2	5
AgentSociety Challenge: Designing LLM Agents for User Modeling and Recommendation on Web Platforms	Feb 26, 2025	Language ModelingLanguage Modelling	CodeCode Available	2	5
Agent Smith: A Single Image Can Jailbreak One Million Multimodal LLM Agents Exponentially Fast	Feb 13, 2024	Language ModellingLarge Language Model	CodeCode Available	2	5
AgentSims: An Open-Source Sandbox for Large Language Model Evaluation	Aug 8, 2023	Language Model EvaluationLanguage Modeling	CodeCode Available	2	5
cadrille: Multi-modal CAD Reconstruction with Online Reinforcement Learning	May 28, 2025	CAD ReconstructionLarge Language Model	CodeCode Available	2	5
Large Language Model with Region-guided Referring and Grounding for CT Report Generation	Nov 23, 2024	Computed Tomography (CT)Diagnostic	CodeCode Available	2	5
Breaking the Ceiling of the LLM Community by Treating Token Generation as a Classification for Ensembling	Jun 18, 2024	Arithmetic ReasoningLanguage Modeling	CodeCode Available	2	5
Large Language Model Guided Tree-of-Thought	May 15, 2023	Language ModelingLanguage Modelling	CodeCode Available	2	5
Large Language Model Psychometrics: A Systematic Review of Evaluation, Validation, and Enhancement	May 13, 2025	BenchmarkingLanguage Modeling	CodeCode Available	2	5
Large Language Model Enhanced Recommender Systems: A Survey	Dec 18, 2024	Language ModelingLanguage Modelling	CodeCode Available	2	5
AgentReview: Exploring Peer Review Dynamics with LLM Agents	Jun 18, 2024	Language ModelingLanguage Modelling	CodeCode Available	2	5
Diff-eRank: A Novel Rank-Based Metric for Evaluating Large Language Models	Jan 30, 2024	Data CompressionLanguage Modelling	CodeCode Available	2	5
Large Language Model Safety: A Holistic Survey	Dec 23, 2024	Language ModelingLanguage Modelling	CodeCode Available	2	5
Large Language Model Can Transcribe Speech in Multi-Talker Scenarios with Versatile Instructions	Sep 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2	5
LLMEmb: Large Language Model Can Be a Good Embedding Generator for Sequential Recommendation	Sep 30, 2024	AttributeCollaborative Filtering	CodeCode Available	2	5
Large language models can be zero-shot anomaly detectors for time series?	May 23, 2024	Anomaly DetectionLanguage Modeling	CodeCode Available	2	5
Language Models Can Improve Event Prediction by Few-Shot Abductive Reasoning	May 26, 2023	Language ModelingLanguage Modelling	CodeCode Available	2	5
KoSBi: A Dataset for Mitigating Social Bias Risks Towards Safer Large Language Model Application	May 28, 2023	Language ModelingLanguage Modelling	CodeCode Available	2	5
Language Models can Solve Computer Tasks	Mar 30, 2023	Language ModellingLarge Language Model	CodeCode Available	2	5
CPRet: A Dataset, Benchmark, and Model for Retrieval in Competitive Programming	May 19, 2025	FairnessLarge Language Model	CodeCode Available	2	5
CyberGym: Evaluating AI Agents' Cybersecurity Capabilities with Real-World Vulnerabilities at Scale	Jun 3, 2025	Large Language Model	CodeCode Available	2	5
biorecap: an R package for summarizing bioRxiv preprints with a local LLM	Aug 21, 2024	Language ModellingLarge Language Model	CodeCode Available	2	5
KnowCoder: Coding Structured Knowledge into LLMs for Universal Information Extraction	Mar 12, 2024	Code GenerationLanguage Modelling	CodeCode Available	2	5

Show:10 25 50

← PrevPage 6 of 122Next →

No leaderboard results yet.