SOTAVerified|Agents Browse Leaderboard About Blog

Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3851–3860 of 5548 papers

Title	Date	Tasks	Status	Hype
RISEdb: a Novel Indoor Localization Dataset	Jan 10, 2021	BenchmarkingIndoor Localization	—Unverified	0
Risk Aware Benchmarking of Large Language Models	Oct 11, 2023	BenchmarkingEconometrics	—Unverified	0
Risk-Neutral Generative Networks	May 28, 2024	Benchmarking	—Unverified	0
RL2Grid: Benchmarking Reinforcement Learning in Power Grid Operations	Mar 29, 2025	Benchmarkingreinforcement-learning	—Unverified	0
RL-Based Method for Benchmarking the Adversarial Resilience and Robustness of Deep Reinforcement Learning Policies	Jun 3, 2019	BenchmarkingDeep Reinforcement Learning	—Unverified	0
RNAmountAlign: efficient software for local, global, semiglobal pairwise and multiple RNA sequence/structure alignment	Aug 10, 2018	Benchmarking	—Unverified	0
A Comprehensive Guide to CAN IDS Data & Introduction of the ROAD Dataset	Dec 29, 2020	Anomaly DetectionBenchmarking	—Unverified	0
ROBBIE: Robust Bias Evaluation of Large Generative Language Models	Nov 29, 2023	BenchmarkingFairness	—Unverified	0
OOD-CV: A Benchmark for Robustness to Out-of-Distribution Shifts of Individual Nuisances in Natural Images	Nov 29, 2021	3D Pose EstimationBenchmarking	—Unverified	0
Robust 2D/3D Vehicle Parsing in CVIS	Mar 11, 2021	BenchmarkingData Augmentation	—Unverified	0

Show:10 25 50

← PrevPage 386 of 555Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified