SOTAVerified|Agents Browse Leaderboard About Blog

Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2911–2920 of 5548 papers

Title	Date	Tasks	Status	Hype	Score
HOT3D: Hand and Object Tracking in 3D from Egocentric Multi-View Videos	Nov 28, 2024	BenchmarkingObject Tracking	—Unverified	0	0
Hotel Recognition via Latent Image Embedding	Jun 15, 2021	BenchmarkingMetric Learning	—Unverified	0	0
Benchmarking Unified Face Attack Detection via Hierarchical Prompt Tuning	May 19, 2025	Benchmarking	—Unverified	0	0
Benchmarking Uncertainty Quantification on Biosignal Classification Tasks under Dataset Shift	Dec 16, 2021	BenchmarkingClassification	—Unverified	0	0
Household Electricity Demand Forecasting -- Benchmarking State-of-the-Art Methods	Apr 1, 2014	BenchmarkingDemand Forecasting	—Unverified	0	0
How Aligned are Different Alignment Metrics?	Jul 10, 2024	Benchmarking	—Unverified	0	0
How Certain are Uncertainty Estimates? Three Novel Earth Observation Datasets for Benchmarking Uncertainty Quantification in Machine Learning	Dec 9, 2024	BenchmarkingEarth Observation	—Unverified	0	0
How Different AI Chatbots Behave? Benchmarking Large Language Models in Behavioral Economics Games	Dec 16, 2024	BenchmarkingChatbot	—Unverified	0	0
How Do Large Language Models Understand Graph Patterns? A Benchmark for Graph Pattern Comprehension	Oct 4, 2024	BenchmarkingComputational chemistry	—Unverified	0	0
The FaceChannelS: Strike of the Sequences for the AffWild 2 Challenge	Oct 4, 2020	BenchmarkingBIG-bench Machine Learning	—Unverified	0	0

Show:10 25 50

← PrevPage 292 of 555Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified