SOTAVerified|Agents Browse Leaderboard About Blog

Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2691–2700 of 5548 papers

Title	Date	Tasks	Status	Hype	Score
Apples to Apples: Learning Semantics of Common Entities Through a Novel Comprehension Task	Jul 1, 2017	BenchmarkingPart-Of-Speech Tagging	—Unverified	0	0
Advocating Character Error Rate for Multilingual ASR Evaluation	Oct 9, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0	0
Decentralized Federated Learning on the Edge over Wireless Mesh Networks	Nov 2, 2023	BenchmarkingFederated Learning	—Unverified	0	0
Benchmarking for Public Health Surveillance tasks on Social Media with a Domain-Specific Pretrained Language Model	Apr 9, 2022	BenchmarkingLanguage Modeling	—Unverified	0	0
DECASTE: Unveiling Caste Stereotypes in Large Language Models through Multi-Dimensional Bias Analysis	May 20, 2025	BenchmarkingFairness	—Unverified	0	0
Benchmarking for Metaheuristic Black-Box Optimization: Perspectives and Open Challenges	Jul 1, 2020	BenchmarkingMetaheuristic Optimization	—Unverified	0	0
DeAR: Debiasing Vision-Language Models with Additive Residuals	Mar 18, 2023	AttributeBenchmarking	—Unverified	0	0
DDR-ID: Dual Deep Reconstruction Networks Based Image Decomposition for Anomaly Detection	Jul 18, 2020	Adversarial AttackAdversarial Attack Detection	—Unverified	0	0
Benchmarking for Bayesian Reinforcement Learning	Sep 14, 2015	Benchmarkingreinforcement-learning	—Unverified	0	0
DBsurf: A Discrepancy Based Method for Discrete Stochastic Gradient Estimation	Sep 7, 2023	BenchmarkingNeural Architecture Search	—Unverified	0	0

Show:10 25 50

← PrevPage 270 of 555Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified