SOTAVerified|Agents Browse Leaderboard About Blog

Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3941–3950 of 5548 papers

Title	Date	Tasks	Status	Hype
From Modern CNNs to Vision Transformers: Assessing the Performance, Robustness, and Classification Strategies of Deep Learning Models in Histopathology	Apr 11, 2022	BenchmarkingCancer Classification	CodeCode Available	0
Data Splits and Metrics for Method Benchmarking on Surgical Action Triplet Datasets	Apr 11, 2022	Action Triplet RecognitionBenchmarking	CodeCode Available	1
Metaethical Perspectives on 'Benchmarking' AI Ethics	Apr 11, 2022	BenchmarkingEthics	—Unverified	0
Benchmarking for Public Health Surveillance tasks on Social Media with a Domain-Specific Pretrained Language Model	Apr 9, 2022	BenchmarkingLanguage Modeling	—Unverified	0
BioRED: A Rich Biomedical Relation Extraction Dataset	Apr 8, 2022	BenchmarkingBinary Relation Extraction	CodeCode Available	1
Disability prediction in multiple sclerosis using performance outcome measures and demographic data	Apr 8, 2022	BenchmarkingBIG-bench Machine Learning	—Unverified	0
tmVar 3.0: an improved variant concept recognition and normalization tool	Apr 7, 2022	Benchmarking	—Unverified	0
Deep Visual Geo-localization Benchmark	Apr 7, 2022	BenchmarkingData Augmentation	CodeCode Available	2
The Moral Integrity Corpus: A Benchmark for Ethical Dialogue Systems	Apr 6, 2022	AttributeBenchmarking	CodeCode Available	1
CLEAVE: Scalable and Edge-native Benchmarking of Networked Control Systems	Apr 5, 2022	BenchmarkingEdge-computing	CodeCode Available	0

Show:10 25 50

← PrevPage 395 of 555Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified