SOTAVerified|Agents Browse Leaderboard About Blog

Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3041–3050 of 5548 papers

Title	Date	Tasks	Status	Hype	Score
Improving Items and Contexts Understanding with Descriptive Graph for Conversational Recommendation	Apr 11, 2023	BenchmarkingConversational Recommendation	—Unverified	0	0
Improving Medical Image Classification with Label Noise Using Dual-uncertainty Estimation	Feb 28, 2021	BenchmarkingGeneral Classification	—Unverified	0	0
Improving Model Generalization: A Chinese Named Entity Recognition Case Study	Aug 1, 2021	BenchmarkingChinese Named Entity Recognition	—Unverified	0	0
Improving Named Entity Linking Corpora Quality	Sep 1, 2019	BenchmarkingEntity Linking	—Unverified	0	0
Improving plant disease classification by adaptive minimal ensembling	Sep 8, 2022	BenchmarkingClassification	—Unverified	0	0
The Paradox of Success in Evolutionary and Bioinspired Optimization: Revisiting Critical Issues, Key Studies, and Methodological Pathways	Jan 13, 2025	BenchmarkingMetaheuristic Optimization	—Unverified	0	0
Improving Reference-based Distinctive Image Captioning with Contrastive Rewards	Jun 25, 2023	BenchmarkingContrastive Learning	—Unverified	0	0
Improving seasonal forecast using probabilistic deep learning	Oct 27, 2020	BenchmarkingDeep Learning	—Unverified	0	0
The ParClusterers Benchmark Suite (PCBS): A Fine-Grained Analysis of Scalable Graph Clustering	Nov 15, 2024	BenchmarkingClustering	—Unverified	0	0
Improving the Validity and Practical Usefulness of AI/ML Evaluations Using an Estimands Framework	Jun 14, 2024	Benchmarking	—Unverified	0	0

Show:10 25 50

← PrevPage 305 of 555Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified