SOTAVerified|Agents Browse Leaderboard About Blog

Decision Making

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 41–50 of 12311 papers

Title	Date	Tasks	Status	Hype	Score
Hierarchical Prompting Assists Large Language Model on Web Navigation	May 23, 2023	Decision MakingLanguage Modeling	CodeCode Available	3	5
FlashDepth: Real-time Streaming Video Depth Estimation at 2K Resolution	Apr 9, 2025	2kDecision Making	CodeCode Available	3	5
Beyond A*: Better Planning with Transformers via Search Dynamics Bootstrapping	Feb 21, 2024	Decision MakingDecoder	CodeCode Available	3	5
Game-theoretic LLM: Agent Workflow for Negotiation Games	Nov 8, 2024	Decision Making	CodeCode Available	3	5
Automatic Gradient Estimation for Calibrating Crowd Models with Discrete Decision Making	Apr 6, 2024	Decision Making	CodeCode Available	3	5
ACEGEN: Reinforcement learning of generative chemical agents for drug discovery	May 7, 2024	BenchmarkingDecision Making	CodeCode Available	3	5
Evaluating Language Model Agency through Negotiations	Jan 9, 2024	Decision MakingLanguage Modeling	CodeCode Available	3	5
A Demonstration of Adaptive Collaboration of Large Language Models for Medical Decision-Making	Oct 31, 2024	Decision MakingDiagnostic	CodeCode Available	3	5
Automated Hypothesis Validation with Agentic Sequential Falsifications	Feb 14, 2025	Decision MakingHallucination	CodeCode Available	3	5
Auto-RAG: Autonomous Retrieval-Augmented Generation for Large Language Models	Nov 29, 2024	Decision MakingRAG	CodeCode Available	3	5

Show:10 25 50

← PrevPage 5 of 1232Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SRLA	Average Remaining Cycles	6.4	—	Unverified