Decision Making

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 12311 papers

Title	Date	Tasks	Status	Hype
LIBERO: Benchmarking Knowledge Transfer for Lifelong Robot Learning	Jun 5, 2023	Benchmarking	CodeCode Available	3
Planning with Diffusion for Flexible Behavior Synthesis	May 20, 2022	Decision MakingDenoising	CodeCode Available	3
Hierarchical Prompting Assists Large Language Model on Web Navigation	May 23, 2023	Decision MakingLanguage Modeling	CodeCode Available	3
MDAgents: An Adaptive Collaboration of LLMs for Medical Decision-Making	Apr 22, 2024	Decision MakingMedical Diagnosis	CodeCode Available	3
Beyond A*: Better Planning with Transformers via Search Dynamics Bootstrapping	Feb 21, 2024	Decision MakingDecoder	CodeCode Available	3
Beyond Quacking: Deep Integration of Language Models and RAG into DuckDB	Apr 1, 2025	Decision MakingRAG	CodeCode Available	3
FlashDepth: Real-time Streaming Video Depth Estimation at 2K Resolution	Apr 9, 2025	2kDecision Making	CodeCode Available	3
Auto-RAG: Autonomous Retrieval-Augmented Generation for Large Language Models	Nov 29, 2024	Decision MakingRAG	CodeCode Available	3
Behavior Generation with Latent Actions	Mar 5, 2024	Autonomous DrivingDecision Making	CodeCode Available	3
Evolve Cost-aware Acquisition Functions Using Large Language Models	Apr 25, 2024	Bayesian OptimizationDecision Making	CodeCode Available	3
Game-theoretic LLM: Agent Workflow for Negotiation Games	Nov 8, 2024	Decision Making	CodeCode Available	3
A Survey on the Optimization of Large Language Model-based Agents	Mar 16, 2025	Decision MakingLanguage Modeling	CodeCode Available	3
ACEGEN: Reinforcement learning of generative chemical agents for drug discovery	May 7, 2024	BenchmarkingDecision Making	CodeCode Available	3
AuctionNet: A Novel Benchmark for Decision-Making in Large-Scale Games	Dec 14, 2024	Decision Making	CodeCode Available	3
A Smart Multimodal Healthcare Copilot with Powerful LLM Reasoning	Jun 3, 2025	Decision MakingDiagnostic	CodeCode Available	3
Enhancing Decision Analysis with a Large Language Model: pyDecision a Comprehensive Library of MCDA Methods in Python	Apr 9, 2024	Decision MakingLanguage Modeling	CodeCode Available	3
Embodied Agent Interface: Benchmarking LLMs for Embodied Decision Making	Oct 9, 2024	BenchmarkingDecision Making	CodeCode Available	3
Embodied CoT Distillation From LLM To Off-the-shelf Agents	Dec 16, 2024	Decision MakingIn-Context Learning	CodeCode Available	3
Evaluating Language Model Agency through Negotiations	Jan 9, 2024	Decision MakingLanguage Modeling	CodeCode Available	3
Attention is not not Explanation	Aug 13, 2019	Decision MakingDiagnostic	CodeCode Available	3
DiLu: A Knowledge-Driven Approach to Autonomous Driving with Large Language Models	Sep 28, 2023	10-shot image generation1 Image, 2*2 Stitchi	CodeCode Available	2
Digital Player: Evaluating Large Language Models based Human-like Agent in Games	Feb 28, 2025	Decision Making	CodeCode Available	2
Disentangling Memory and Reasoning Ability in Large Language Models	Nov 20, 2024	Decision MakingRetrieval	CodeCode Available	2
Diffusion Actor-Critic with Entropy Regulator	May 24, 2024	Decision MakingMuJoCo	CodeCode Available	2
Distribution-Free, Risk-Controlling Prediction Sets	Jan 7, 2021	BIG-bench Machine LearningClassification	CodeCode Available	2

Show:10 25 50

← PrevPage 3 of 493Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SRLA	Average Remaining Cycles	6.4	—	Unverified