SOTAVerified|Agents Browse Leaderboard About Blog

Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3681–3690 of 5548 papers

Title	Date	Tasks	Status	Hype
Point Cloud Objective Quality: Benchmarking Features and Quality Evaluation	Apr 4, 2025	AttributeBenchmarking	—Unverified	0
Polarization and Index Modulations: a Theoretical and Practical Perspective	Mar 20, 2018	BenchmarkingNavigate	—Unverified	0
Policy Entropy for Out-of-Distribution Classification	May 25, 2020	BenchmarkingClassification	—Unverified	0
Polyp-E: Benchmarking the Robustness of Deep Segmentation Models via Polyp Editing	Oct 22, 2024	AttributeBenchmarking	—Unverified	0
Portfolio Benchmarking under Drawdown Constraint and Stochastic Sharpe Ratio	Oct 26, 2016	Benchmarking	—Unverified	0
PoseBench: Benchmarking the Robustness of Pose Estimation Models under Corruptions	Jun 20, 2024	Animal Pose EstimationAutonomous Driving	—Unverified	0
Pose Estimation for Non-Cooperative Spacecraft Rendezvous Using Convolutional Neural Networks	Sep 19, 2018	BenchmarkingImage Generation	—Unverified	0
Position: AI Competitions Provide the Gold Standard for Empirical Rigor in GenAI Evaluation	May 1, 2025	BenchmarkingPosition	—Unverified	0
Position: Benchmarking is Limited in Reinforcement Learning Research	Jun 23, 2024	BenchmarkingPosition	—Unverified	0
Position: Graph Learning Will Lose Relevance Due To Poor Benchmarks	Feb 20, 2025	BenchmarkingCombinatorial Optimization	—Unverified	0

Show:10 25 50

← PrevPage 369 of 555Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified