SOTAVerified|Agents Browse Leaderboard About Blog

Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3851–3860 of 5548 papers

Title	Date	Tasks	Status	Hype	Score
Benchmarking Cognitive Domains for LLMs: Insights from Taiwanese Hakka Culture	Sep 3, 2024	BenchmarkingRAG	—Unverified	0	0
Benchmarking CNN on 3D Anatomical Brain MRI: Architectures, Data Augmentation and Deep Ensemble Learning	Jun 2, 2021	BenchmarkingData Augmentation	—Unverified	0	0
Benchmarking Clinical Decision Support Search	Jan 29, 2018	ArticlesBenchmarking	—Unverified	0	0
No Dataset Needed for Downstream Knowledge Benchmarking: Response Dispersion Inversely Correlates with Accuracy on Domain-specific QA	Aug 24, 2024	BenchmarkingChatbot	—Unverified	0	0
NODDI-SH: a computational efficient NODDI extension for fODF estimation in diffusion MRI	Aug 28, 2017	BenchmarkingDiffusion MRI	—Unverified	0	0
Benchmarking Classical, Deep, and Generative Models for Human Activity Recognition	Jan 14, 2025	Activity RecognitionBenchmarking	—Unverified	0	0
Node Classification Meets Link Prediction on Knowledge Graphs	Jun 14, 2021	BenchmarkingClassification	—Unverified	0	0
Nodule detection and generation on chest X-rays: NODE21 Challenge	Jan 4, 2024	Benchmarking	—Unverified	0	0
Training Transformers with Enforced Lipschitz Constants	Jul 17, 2025	Benchmarking	—Unverified	0	0
NoisyEQA: Benchmarking Embodied Question Answering Against Noisy Queries	Dec 14, 2024	BenchmarkingEmbodied Question Answering	—Unverified	0	0

Show:10 25 50

← PrevPage 386 of 555Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified