Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5151–5200 of 5548 papers

Title	Date	Tasks	Status
Dynamic Risk Assessment Methodology with an LDM-based System for Parking Scenarios	Apr 5, 2024	Benchmarking	—Unverified
A Synthetic Benchmarking Pipeline to Compare Camera Calibration Algorithms	Jul 3, 2023	BenchmarkingCamera Calibration	—Unverified
DynamicVL: Benchmarking Multimodal Large Language Models for Dynamic City Understanding	May 27, 2025	BenchmarkingChange Detection	—Unverified
Almost Equivariance via Lie Algebra Convolutions	Oct 19, 2023	Benchmarking	—Unverified
COCO: The Experimental Procedure	Mar 29, 2016	Benchmarking	—Unverified
Benchmarking In-the-wild Multimodal Disease Recognition and A Versatile Baseline	Aug 6, 2024	Benchmarking	—Unverified
VisionKG: Unleashing the Power of Visual Datasets via Knowledge Graph	Sep 24, 2023	BenchmarkingKnowledge Graphs	—Unverified
E2E Parking Dataset: An Open Benchmark for End-to-End Autonomous Parking	Apr 15, 2025	BenchmarkingPosition	—Unverified
A biologically-inspired multi-modal evaluation of molecular generative machine learning	Aug 20, 2022	BenchmarkingDrug Discovery	—Unverified
CMOS based image cytometry for detection of phytoplankton in ballast water	Nov 21, 2016	Benchmarking	—Unverified
EarthquakeNPP: Benchmark Datasets for Earthquake Forecasting with Neural Point Processes	Sep 27, 2024	BenchmarkingDataset Generation	—Unverified
EASTER: Efficient and Scalable Text Recognizer	Aug 18, 2020	BenchmarkingHandwritten Text Recognition	—Unverified
CMAWRNet: Multiple Adverse Weather Removal via a Unified Quaternion Neural Architecture	May 3, 2025	Autonomous DrivingBenchmarking	—Unverified
CloudifierNet -- Deep Vision Models for Artificial Image Processing	Nov 4, 2019	BenchmarkingCode Generation	—Unverified
Vision Learners Meet Web Image-Text Pairs	Jan 17, 2023	BenchmarkingSelf-Supervised Learning	—Unverified
CLLMate: A Multimodal Benchmark for Weather and Climate Events Forecasting	Sep 27, 2024	ArticlesBenchmarking	—Unverified
ECG-Adv-GAN: Detecting ECG Adversarial Examples with Conditional Generative Adversarial Networks	Jul 16, 2021	BenchmarkingGenerative Adversarial Network	—Unverified
Synthetic Video Generation for Robust Hand Gesture Recognition in Augmented Reality Applications	Nov 4, 2019	BenchmarkingGesture Recognition	—Unverified
ECKGBench: Benchmarking Large Language Models in E-commerce Leveraging Knowledge Graph	Mar 20, 2025	BenchmarkingHallucination	—Unverified
EconGym: A Scalable AI Testbed with Diverse Economic Tasks	Jun 13, 2025	Benchmarking	—Unverified
EconWebArena: Benchmarking Autonomous Agents on Economic Tasks in Realistic Web Environments	Jun 9, 2025	BenchmarkingNavigate	—Unverified
CLIRudit: Cross-Lingual Information Retrieval of Scientific Documents	Apr 22, 2025	BenchmarkingCross-Lingual Information Retrieval	—Unverified
clem:todd: A Framework for the Systematic Benchmarking of LLM-Based Task-Oriented Dialogue System Realisations	May 8, 2025	BenchmarkingTask-Oriented Dialogue Systems	—Unverified
Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey	May 3, 2025	Autonomous DrivingBenchmarking	—Unverified
Edge-First Language Model Inference: Models, Metrics, and Tradeoffs	May 22, 2025	BenchmarkingLanguage Modeling	—Unverified
EdgeMark: An Automation and Benchmarking System for Embedded Artificial Intelligence Tools	Feb 3, 2025	Benchmarking	—Unverified
Synthetic weather radar using hybrid quantum-classical machine learning	Nov 30, 2021	BenchmarkingBIG-bench Machine Learning	—Unverified
EditVal: Benchmarking Diffusion Based Text-Guided Image Editing Methods	Oct 3, 2023	Benchmarkingtext-guided-image-editing	—Unverified
Classifying neuromorphic data using a deep learning framework for image classification	Jul 2, 2018	BenchmarkingDeep Learning	—Unverified
EEGS: A Transparent Model of Emotions	Nov 4, 2020	Benchmarkingmodel	—Unverified
EffCNet: An Efficient CondenseNet for Image Classification on NXP BlueBox	Nov 28, 2021	BenchmarkingClassification	—Unverified
Scaling laws in global corporations as a benchmarking approach to assess environmental performance	Jun 7, 2022	BenchmarkingOpen-Ended Question Answering	—Unverified
Effective Evaluation of Deep Active Learning on Image Classification Tasks	Jun 16, 2021	Active LearningBenchmarking	—Unverified
Effective Transfer of Pretrained Large Visual Model for Fabric Defect Segmentation via Specifc Knowledge Injection	Jun 28, 2023	BenchmarkingDiversity	—Unverified
Classification of the Fashion-MNIST Dataset on a Quantum Computer	Mar 4, 2024	BenchmarkingQuantum Machine Learning	—Unverified
Efficacy of Synthetic Data as a Benchmark	Sep 18, 2024	BenchmarkingFew-Shot Learning	—Unverified
Efficiency in European Air Traffic Management -- A Fundamental Analysis of Data, Models, and Methods	Feb 15, 2023	BenchmarkingDecision Making	—Unverified
Efficient computation of backprojection arrays for 3D light field deconvolution	Mar 20, 2020	Benchmarking	—Unverified
Efficient and Accurate In-Database Machine Learning with SQL Code Generation in Python	Apr 7, 2021	BenchmarkingBIG-bench Machine Learning	—Unverified
A Benchmarking Protocol for SAR Colorization: From Regression to Deep Learning Approaches	Oct 12, 2023	BenchmarkingColorization	—Unverified
SynthRAD2025 Grand Challenge dataset: generating synthetic CTs for radiotherapy	Feb 24, 2025	BenchmarkingImage Generation	—Unverified
Efficient Benchmarking of Algorithm Configuration Procedures via Model-Based Surrogates	Mar 30, 2017	BenchmarkingHyperparameter Optimization	—Unverified
Efficient Benchmarking of Language Models	Aug 22, 2023	BenchmarkingGPU	—Unverified
Efficient Benchmarking of NLP APIs using Multi-armed Bandits	Apr 1, 2017	BenchmarkingMulti-Armed Bandits	—Unverified
Efficient but Vulnerable: Benchmarking and Defending LLM Batch Prompting Attack	Mar 18, 2025	8kBenchmarking	—Unverified
Efficient Channel Estimation for Millimeter Wave and Terahertz Systems Enabled by Integrated Super-resolution Sensing and Communication	Jul 30, 2024	BenchmarkingSuper-Resolution	—Unverified
Classification and Retrieval of Digital Pathology Scans: A New Dataset	May 22, 2017	BenchmarkingGeneral Classification	—Unverified
Efficient Exploration of Image Classifier Failures with Bayesian Optimization and Text-to-Image Models	Apr 26, 2024	AttributeBayesian Optimization	—Unverified
Efficient Expression Neutrality Estimation with Application to Face Recognition Utility Prediction	Feb 8, 2024	BenchmarkingFace Image Quality	—Unverified
Efficiently Exploring Ordering Problems through Conflict-directed Search	Apr 15, 2019	BenchmarkingScheduling	—Unverified

Show:10 25 50

← PrevPage 104 of 111Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified