SOTAVerified|Agents Browse Leaderboard About

Decision Making

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 181–190 of 12311 papers

Title	Date	Tasks	Status	Hype
BOLAA: Benchmarking and Orchestrating LLM-augmented Autonomous Agents	Aug 11, 2023	BenchmarkingDecision Making	CodeCode Available	2
Cumulative Reasoning with Large Language Models	Aug 8, 2023	Decision MakingLogical Reasoning	CodeCode Available	2
Global birdsong embeddings enable superior transfer learning for bioacoustic classification	Jul 12, 2023	Audio ClassificationDecision Making	CodeCode Available	2
Jumanji: a Diverse Suite of Scalable Reinforcement Learning Environments in JAX	Jun 16, 2023	Decision Makingreinforcement-learning	CodeCode Available	2
Adversarial attacks and defenses in explainable artificial intelligence: A survey	Jun 6, 2023	Decision MakingExplainable artificial intelligence	CodeCode Available	2
STEVE-1: A Generative Model for Text-to-Behavior in Minecraft	Jun 1, 2023	Decision MakingImage Generation	CodeCode Available	2
Harnessing Explanations: LLM-to-LM Interpreter for Enhanced Text-Attributed Graph Representation Learning	May 31, 2023	Decision MakingGeneral Knowledge	CodeCode Available	2
Training Diffusion Models with Reinforcement Learning	May 22, 2023	Decision MakingDenoising	CodeCode Available	2
AGIEval: A Human-Centric Benchmark for Evaluating Foundation Models	Apr 13, 2023	Decision MakingMath	CodeCode Available	2
Large AI Models in Health Informatics: Applications, Challenges, and the Future	Mar 21, 2023	Decision MakingDrug Discovery	CodeCode Available	2

Show:10 25 50

← PrevPage 19 of 1232Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SRLA	Average Remaining Cycles	6.4	—	Unverified