SOTAVerified|Agents Browse Leaderboard About

Decision Making

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 341–350 of 12311 papers

Title	Date	Tasks	Status	Hype
Learning Temporal Distances: Contrastive Successor Features Can Provide a Metric Structure for Decision-Making	Jun 24, 2024	Contrastive LearningDecision Making	CodeCode Available	1
What Do VLMs NOTICE? A Mechanistic Interpretability Pipeline for Gaussian-Noise-free Text-Image Corruption and Evaluation	Jun 24, 2024	Decision MakingFacial Expression Recognition	CodeCode Available	1
ImageFlowNet: Forecasting Multiscale Image-Level Trajectories of Disease Progression with Irregularly-Sampled Longitudinal Medical Images	Jun 20, 2024	Decision MakingMedical Image Analysis	CodeCode Available	1
Ask-before-Plan: Proactive Language Agents for Real-World Planning	Jun 18, 2024	Decision Makingvalid	CodeCode Available	1
Statistical Uncertainty in Word Embeddings: GloVe-V	Jun 18, 2024	Decision MakingModel Selection	CodeCode Available	1
LUMA: A Benchmark Dataset for Learning from Uncertain and Multimodal Data	Jun 14, 2024	BenchmarkingDecision Making	CodeCode Available	1
Beyond ELBOs: A Large-Scale Evaluation of Variational Methods for Sampling	Jun 11, 2024	Decision MakingVariational Inference	CodeCode Available	1
Open Grounded Planning: Challenges and Benchmark Construction	Jun 5, 2024	Decision MakingText Generation	CodeCode Available	1
RATT: A Thought Structure for Coherent and Correct LLM Reasoning	Jun 4, 2024	Decision MakingFact Checking	CodeCode Available	1
Towards Rationality in Language and Multimodal Agents: A Survey	Jun 1, 2024	Decision MakingSurvey	CodeCode Available	1

Show:10 25 50

← PrevPage 35 of 1232Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SRLA	Average Remaining Cycles	6.4	—	Unverified