Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3451–3475 of 5548 papers

Title	Date	Tasks	Status
Multifactorial Cellular Genetic Algorithm (MFCGA): Algorithmic Design, Performance Comparison and Genetic Transferability Analysis	Mar 24, 2020	BenchmarkingTransfer Learning	—Unverified
Multi-Fidelity Methods for Optimization: A Survey	Feb 15, 2024	BenchmarkingComputational Efficiency	—Unverified
MultiHuman-Testbench: Benchmarking Image Generation for Multiple Humans	Jun 25, 2025	Action DetectionBenchmarking	—Unverified
Multi-input Multi-output Loewner Framework for Vibration-based Damage Detection on a Trainer Jet	Oct 26, 2024	BenchmarkingCantilever Beam	—Unverified
Multi-label classification for biomedical literature: an overview of the BioCreative VII LitCovid Track for COVID-19 literature topic annotations	Apr 20, 2022	ArticlesBenchmarking	—Unverified
Multilingual European Language Models: Benchmarking Approaches and Challenges	Feb 18, 2025	BenchmarkingQuestion Answering	—Unverified
Multilingual Large Language Models Are Not (Yet) Code-Switchers	May 23, 2023	BenchmarkingLanguage Identification	—Unverified
Multilingual Protest News Detection - Shared Task 1, CASE 2021	Aug 1, 2021	BenchmarkingDecision Making	—Unverified
MultiMed: Massively Multimodal and Multitask Medical Understanding	Aug 22, 2024	BenchmarkingMedical Question Answering	—Unverified
Multimodal ArXiv: A Dataset for Improving Scientific Comprehension of Large Vision-Language Models	Mar 1, 2024	BenchmarkingMathematical Reasoning	—Unverified
Multimodal Deep Learning for Scientific Imaging Interpretation	Sep 21, 2023	ArticlesBenchmarking	—Unverified
Multimodal Deep Reinforcement Learning for Portfolio Optimization	Dec 23, 2024	ArticlesBenchmarking	—Unverified
Multi-Modal Explainable Medical AI Assistant for Trustworthy Human-AI Collaboration	May 11, 2025	BenchmarkingDescriptive	—Unverified
Multimodal Information Retrieval for Open World with Edit Distance Weak Supervision	Jun 25, 2025	BenchmarkingInformation Retrieval	—Unverified
Multimodal or Text? Retrieval or BERT? Benchmarking Classifiers for the Shared Task on Hateful Memes	Aug 1, 2021	BenchmarkingBinary Classification	—Unverified
Multi-Modal Three-Stream Network for Action Recognition	Sep 8, 2019	Action ClassificationAction Recognition	—Unverified
MultiON: Benchmarking Semantic Map Memory using Multi-Object Navigation	Dec 7, 2020	BenchmarkingObject	—Unverified
LadderMIL: Multiple Instance Learning with Coarse-to-Fine Self-Distillation	Feb 4, 2025	BenchmarkingClassification	—Unverified
MultiRobustBench: Benchmarking Robustness Against Multiple Attacks	Feb 21, 2023	Benchmarking	—Unverified
MultiSocial: Multilingual Benchmark of Machine-Generated Text Detection of Social-Media Texts	Jun 18, 2024	ArticlesBenchmarking	—Unverified
MultiSpider: Towards Benchmarking Multilingual Text-to-SQL Semantic Parsing	Dec 27, 2022	BenchmarkingSemantic Parsing	—Unverified
Non-linear Multitask Learning with Deep Gaussian Processes	May 29, 2019	BenchmarkingGaussian Processes	—Unverified
Multivariate Stochastic Dominance via Optimal Transport and Applications to Models Benchmarking	Jun 10, 2024	BenchmarkingEconometrics	—Unverified
Multiview Aerial Visual Recognition (MAVREC): Can Multi-view Improve Aerial Visual Perception?	Dec 7, 2023	BenchmarkingDiversity	—Unverified
Multi-view deep learning based molecule design and structural optimization accelerates the SARS-CoV-2 inhibitor discovery	Dec 3, 2022	BenchmarkingRepresentation Learning	—Unverified

Show:10 25 50

← PrevPage 139 of 222Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified