SOTAVerified|Agents Browse Leaderboard About

Decision Making

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 711–720 of 12311 papers

Title	Date	Tasks	Status	Hype	Score
CARL-GT: Evaluating Causal Reasoning Capabilities of Large Language Models	Dec 23, 2024	Decision MakingMath	CodeCode Available	1	5
Hyp2Nav: Hyperbolic Planning and Curiosity for Crowd Navigation	Jul 18, 2024	Computational EfficiencyDecision Making	CodeCode Available	1	5
IdentiFace : A VGG Based Multimodal Facial Biometric System	Jan 2, 2024	Decision MakingEmotion Recognition	CodeCode Available	1	5
Rejecting Hallucinated State Targets during Planning	Oct 9, 2024	Decision MakingOut-of-Distribution Generalization	CodeCode Available	1	5
Do the Rewards Justify the Means? Measuring Trade-Offs Between Rewards and Ethical Behavior in the MACHIAVELLI Benchmark	Apr 6, 2023	Decision MakingEthics	CodeCode Available	1	5
Improving Aleatoric Uncertainty Quantification in Multi-Annotated Medical Image Segmentation with Normalizing Flows	Aug 4, 2021	Decision MakingImage Segmentation	CodeCode Available	1	5
Improving Recommendation Fairness via Data Augmentation	Feb 13, 2023	Collaborative FilteringData Augmentation	CodeCode Available	1	5
Improving Single Domain-Generalized Object Detection: A Focus on Diversification and Alignment	May 23, 2024	Decision MakingDomain Generalization	CodeCode Available	1	5
Achieving Robustness to Aleatoric Uncertainty with Heteroscedastic Bayesian Optimisation	Oct 17, 2019	Bayesian OptimisationDecision Making	CodeCode Available	1	5
Distributional GFlowNets with Quantile Flows	Feb 11, 2023	Decision Making	CodeCode Available	1	5

Show:10 25 50

← PrevPage 72 of 1232Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	SRLA	Average Remaining Cycles	6.4	—	Unverified