SOTAVerified|Agents Browse Leaderboard About Blog

Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3051–3060 of 5548 papers

Title	Date	Tasks	Status	Hype	Score
ImputeGAP: A Comprehensive Library for Time Series Imputation	Mar 19, 2025	BenchmarkingImputation	—Unverified	0	0
Benchmarking Table Comprehension In The Wild	Dec 13, 2024	BenchmarkingQuestion Answering	—Unverified	0	0
InAttention: Linear Context Scaling for Transformers	Oct 9, 2024	BenchmarkingDecoder	—Unverified	0	0
Inaugural MOASEI Competition at AAMAS'2025: A Technical Report	Jul 7, 2025	BenchmarkingDecision Making	—Unverified	0	0
INCLUSIFY: A benchmark and a model for gender-inclusive German	Dec 5, 2022	Benchmarking	—Unverified	0	0
The Partial Response Network: a neural network nomogram	Aug 16, 2019	Additive modelsBenchmarking	—Unverified	0	0
IndicMMLU-Pro: Benchmarking Indic Large Language Models on Multi-Task Language Understanding	Jan 27, 2025	BenchmarkingDiversity	—Unverified	0	0
IndicNLG Benchmark: Multilingual Datasets for Diverse NLG Tasks in Indic Languages	Mar 10, 2022	ArticlesBenchmarking	—Unverified	0	0
IndicSTR12: A Dataset for Indic Scene Text Recognition	Mar 12, 2024	BenchmarkingScene Text Recognition	—Unverified	0	0
Benchmarking Systematic Relational Reasoning with Large Language and Reasoning Models	Mar 30, 2025	BenchmarkingRelational Reasoning	—Unverified	0	0

Show:10 25 50

← PrevPage 306 of 555Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified