SOTAVerified|Agents Browse Leaderboard About Blog

Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3961–3970 of 5548 papers

Title	Date	Tasks	Status	Hype
Is Word Error Rate a good evaluation metric for Speech Recognition in Indic Languages?	Mar 30, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
To Find Waldo You Need Contextual Cues: Debiasing Who's Waldo	Mar 30, 2022	BenchmarkingPerson-centric Visual Grounding	CodeCode Available	0
Earnings-22: A Practical Benchmark for Accents in the Wild	Mar 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Parameter-efficient Model Adaptation for Vision Transformers	Mar 29, 2022	BenchmarkingClassification	CodeCode Available	1
Treatment Learning Causal Transformer for Noisy Image Classification	Mar 29, 2022	BenchmarkingClassification	—Unverified	0
A Unified Study of Machine Learning Explanation Evaluation Metrics	Mar 27, 2022	BenchmarkingBIG-bench Machine Learning	—Unverified	0
Benchmarking Deep AUROC Optimization: Loss Functions and Algorithmic Choices	Mar 27, 2022	Benchmarkingimbalanced classification	—Unverified	0
Benchmarking Algorithms for Automatic License Plate Recognition	Mar 27, 2022	BenchmarkingLicense Plate Recognition	—Unverified	0
Fantastic Questions and Where to Find Them: FairytaleQA -- An Authentic Dataset for Narrative Comprehension	Mar 26, 2022	BenchmarkingQuestion Answering	CodeCode Available	1
Visual Abductive Reasoning	Mar 26, 2022	BenchmarkingSentence	CodeCode Available	1

Show:10 25 50

← PrevPage 397 of 555Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified