SOTAVerified|Agents Browse Leaderboard About

Decision Making

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 171–180 of 12311 papers

Title	Date	Tasks	Status	Hype
Language Agent Tree Search Unifies Reasoning Acting and Planning in Language Models	Oct 6, 2023	Code GenerationDecision Making	CodeCode Available	2
MLAgentBench: Evaluating Language Agents on Machine Learning Experimentation	Oct 5, 2023	BenchmarkingDecision Making	CodeCode Available	2
Driving with LLMs: Fusing Object-Level Vector Modality for Explainable Autonomous Driving	Oct 3, 2023	Action GenerationAutonomous Driving	CodeCode Available	2
AutoDAN: Generating Stealthy Jailbreak Prompts on Aligned Large Language Models	Oct 3, 2023	Decision Making	CodeCode Available	2
GPT-Driver: Learning to Drive with GPT	Oct 2, 2023	Autonomous DrivingAutonomous Vehicles	CodeCode Available	2
Alphazero-like Tree-Search can Guide Large Language Model Decoding and Training	Sep 29, 2023	Decision MakingLanguage Modeling	CodeCode Available	2
DiLu: A Knowledge-Driven Approach to Autonomous Driving with Large Language Models	Sep 28, 2023	10-shot image generation1 Image, 2*2 Stitchi	CodeCode Available	2
Cross-Prediction-Powered Inference	Sep 28, 2023	Decision MakingMissing Labels	CodeCode Available	2
ExpeL: LLM Agents Are Experiential Learners	Aug 20, 2023	Decision MakingTransfer Learning	CodeCode Available	2
MindMap: Knowledge Graph Prompting Sparks Graph of Thoughts in Large Language Models	Aug 17, 2023	Decision MakingHallucination	CodeCode Available	2

Show:10 25 50

← PrevPage 18 of 1232Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SRLA	Average Remaining Cycles	6.4	—	Unverified