SOTAVerified|Agents Browse Leaderboard About

Decision Making

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 461–470 of 12311 papers

Title	Date	Tasks	Status	Hype
Large Language Model as a Policy Teacher for Training Reinforcement Learning Agents	Nov 22, 2023	Decision MakingLanguage Modeling	CodeCode Available	1
From Classification to Clinical Insights: Towards Analyzing and Reasoning About Mobile and Behavioral Health Data With Large Language Models	Nov 21, 2023	Decision Making	CodeCode Available	1
Inherently Interpretable Time Series Classification via Multiple Instance Learning	Nov 16, 2023	Decision MakingMultiple Instance Learning	CodeCode Available	1
DocLens: Multi-aspect Fine-grained Evaluation for Medical Text Generation	Nov 16, 2023	Decision MakingInstruction Following	CodeCode Available	1
ToolTalk: Evaluating Tool-Usage in a Conversational Setting	Nov 15, 2023	Decision Making	CodeCode Available	1
XplainLLM: A Knowledge-Augmented Dataset for Reliable Grounded Explanations in LLMs	Nov 15, 2023	Decision MakingDecoder	CodeCode Available	1
A Comprehensive Evaluation of GPT-4V on Knowledge-Intensive Visual Question Answering	Nov 13, 2023	Decision MakingExplanation Generation	CodeCode Available	1
Real-Time Machine-Learning-Based Optimization Using Input Convex Long Short-Term Memory Network	Nov 13, 2023	Chemical ProcessComputational Efficiency	CodeCode Available	1
Benchmarking PtO and PnO Methods in the Predictive Combinatorial Optimization Regime	Nov 13, 2023	BenchmarkingCombinatorial Optimization	CodeCode Available	1
MonoProb: Self-Supervised Monocular Depth Estimation with Interpretable Uncertainty	Nov 10, 2023	Autonomous VehiclesDecision Making	CodeCode Available	1

Show:10 25 50

← PrevPage 47 of 1232Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SRLA	Average Remaining Cycles	6.4	—	Unverified