SOTAVerified|Agents Browse Leaderboard About Blog

Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4271–4280 of 5548 papers

Title	Date	Tasks	Status	Hype
VFHQ: A High-Quality Dataset and Benchmark for Video Face Super-Resolution	May 6, 2022	BenchmarkingSpeaker Identification	—Unverified	0
Surface Reconstruction from Point Clouds: A Survey and a Benchmark	May 5, 2022	BenchmarkingSurface Reconstruction	—Unverified	0
Learn-to-Race Challenge 2022: Benchmarking Safe Learning and Cross-domain Generalisation in Autonomous Racing	May 5, 2022	Autonomous DrivingAutonomous Racing	—Unverified	0
On Continual Model Refinement in Out-of-Distribution Data Streams	May 4, 2022	BenchmarkingContinual Learning	—Unverified	0
Training Mixed-Domain Translation Models via Federated Learning	May 3, 2022	BenchmarkingFederated Learning	—Unverified	0
MSAMSum: Towards Benchmarking Multi-lingual Dialogue Summarization	May 1, 2022	Benchmarkingdialogue summary	CodeCode Available	0
MMCoQA: Conversational Question Answering over Text, Tables, and Images	May 1, 2022	BenchmarkingConversational Question Answering	CodeCode Available	0
Fantastic Questions and Where to Find Them: FairytaleQA – An Authentic Dataset for Narrative Comprehension	May 1, 2022	BenchmarkingQuestion Answering	—Unverified	0
To Find Waldo You Need Contextual Cues: Debiasing Who’s Waldo	May 1, 2022	BenchmarkingPerson-centric Visual Grounding	CodeCode Available	0
Benchmarking Post-Hoc Interpretability Approaches for Transformer-based Misogyny Detection	May 1, 2022	BenchmarkingHate Speech Detection	CodeCode Available	0

Show:10 25 50

← PrevPage 428 of 555Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified