Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5001–5050 of 5548 papers

Title	Date	Tasks	Status
Design2Code: Benchmarking Multimodal Code Generation for Automated Front-End Engineering	Mar 5, 2024	BenchmarkingCode Generation	—Unverified
Design and benchmarking of a two degree of freedom tendon driver unit for cable-driven wearable technologies	Apr 24, 2025	Benchmarking	—Unverified
Sum Secrecy Rate Maximization for Full Duplex ISAC Systems	Oct 17, 2024	BenchmarkingIntegrated sensing and communication	—Unverified
Design and Realization of a Benchmarking Testbed for Evaluating Autonomous Platooning Algorithms	Feb 14, 2024	Autonomous DrivingBenchmarking	—Unverified
Super-Resolution via Deep Learning	Jun 28, 2017	BenchmarkingDeep Learning	—Unverified
Design, Benchmarking and Explainability Analysis of a Game-Theoretic Framework towards Energy Efficiency in Smart Infrastructure	Oct 16, 2019	BenchmarkingDecision Making	—Unverified
Designing labeled graph classifiers by exploiting the Rényi entropy of the dissimilarity representation	Aug 22, 2014	BenchmarkingClustering	—Unverified
Design of intelligent proofreading system for English translation based on CNN and BERT	Jun 5, 2025	BenchmarkingMachine Translation	—Unverified
Design of Supervision-Scalable Learning Systems: Methodology and Performance Benchmarking	Jun 18, 2022	Benchmarkingimage-classification	—Unverified
Design Target Achievement Index: A Differentiable Metric to Enhance Deep Generative Models in Multi-Objective Inverse Design	May 6, 2022	Benchmarking	—Unverified
Computational and Exploratory Landscape Analysis of the GKLS Generator	Apr 18, 2023	Benchmarkingglobal-optimization	—Unverified
A Meta-Engine Framework for Interleaved Task and Motion Planning using Topological Refinements	Aug 11, 2024	BenchmarkingMotion Planning	—Unverified
Detecting Finger-Vein Presentation Attacks Using 3D Shape & Diffuse Reflectance Decomposition	Dec 3, 2019	BenchmarkingFinger Vein Recognition	—Unverified
Detecting Out-Of-Distribution Samples Using Low-Order Deep Features Statistics	May 1, 2019	Benchmarking	—Unverified
Support Vector Machines and generalisation in HEP	Feb 15, 2017	Benchmarking	—Unverified
Surface Reconstruction from Point Clouds: A Survey and a Benchmark	May 5, 2022	BenchmarkingSurface Reconstruction	—Unverified
Detection and Evaluation of Clusters within Sequential Data	Oct 4, 2022	BenchmarkingClustering	—Unverified
Detection of Adversarial Attacks and Characterization of Adversarial Subspace	Oct 26, 2019	BenchmarkingEnvironmental Sound Classification	—Unverified
Comprehensive Review and Empirical Evaluation of Causal Discovery Algorithms for Numerical Data	Jul 17, 2024	ArticlesBenchmarking	—Unverified
Determinants of Performance in European ATM -- How to Analyze a Diverse Industry	Feb 20, 2023	BenchmarkingManagement	—Unverified
DetoxBench: Benchmarking Large Language Models for Multitask Fraud & Abuse Detection	Sep 9, 2024	Abuse DetectionAbusive Language	—Unverified
detrex: Benchmarking Detection Transformers	Jun 12, 2023	Benchmarkingobject-detection	—Unverified
Comprehensive Energy Footprint Benchmarking of Strong Parallel Electrified Powertrain	Jun 1, 2021	Benchmarkingenergy management	—Unverified
Development details and computational benchmarking of DEPAM	Mar 3, 2019	BenchmarkingDistributed Computing	—Unverified
Device Modeling Bias in ReRAM-based Neural Network Simulations	Nov 29, 2022	Benchmarking	—Unverified
Comprehensive Energy Footprint Benchmarking Algorithm for Electrified Powertrains	Jun 2, 2021	Benchmarkingenergy management	—Unverified
DexGraspNet 2.0: Learning Generative Dexterous Grasping in Large-scale Synthetic Cluttered Scenes	Oct 30, 2024	Benchmarking	—Unverified
SurgBench: A Unified Large-Scale Benchmark for Surgical Video Analysis	Jun 9, 2025	Action ClassificationBenchmarking	—Unverified
Comprehensive Benchmarking of Machine Learning Methods for Risk Prediction Modelling from Large-Scale Survival Data: A UK Biobank Study	Mar 11, 2025	Benchmarking	—Unverified
Comprehensive Benchmarking of Entropy and Margin Based Scoring Metrics for Data Selection	Nov 27, 2023	Active LearningBenchmarking	—Unverified
DFTR: Depth-supervised Fusion Transformer for Salient Object Detection	Mar 12, 2022	BenchmarkingObject	—Unverified
DHP Benchmark: Are LLMs Good NLG Evaluators?	Aug 25, 2024	Benchmarkingnlg evaluation	—Unverified
Diagnosing and Addressing Pitfalls in KG-RAG Datasets: Toward More Reliable Benchmarking	May 29, 2025	BenchmarkingGraph Question Answering	—Unverified
A Benchmarking Environment for Worker Flexibility in Flexible Job Shop Scheduling Problems	Jan 27, 2025	BenchmarkingEvolutionary Algorithms	—Unverified
Dialogue Games for Benchmarking Language Understanding: Motivation, Taxonomy, Strategy	Apr 14, 2023	Benchmarking	—Unverified
Comprehensive Benchmark Datasets for Amharic Scene Text Detection and Recognition	Mar 23, 2022	BenchmarkingScene Text Detection	—Unverified
A Metadata-Driven Approach to Understand Graph Neural Networks	Oct 30, 2023	BenchmarkingGraph Learning	—Unverified
DI-BENCH: Benchmarking Large Language Models on Dependency Inference with Testable Repositories at Scale	Jan 23, 2025	Benchmarking	—Unverified
Surprise Potential as a Measure of Interactivity in Driving Scenarios	Feb 8, 2025	Benchmarking	—Unverified
DIF: A Framework for Benchmarking and Verifying Implicit Bias in LLMs	May 15, 2025	BenchmarkingFairness	—Unverified
Diff5T: Benchmarking Human Brain Diffusion MRI with an Extensive 5.0 Tesla K-Space and Spatial Dataset	Dec 9, 2024	BenchmarkingDiffusion MRI	—Unverified
DiffBody: Human Body Restoration by Imagining with Generative Diffusion Prior	Apr 4, 2024	BenchmarkingImage Restoration	—Unverified
Different Horses for Different Courses: Comparing Bias Mitigation Algorithms in ML	Nov 17, 2024	BenchmarkingFairness	—Unverified
Differential Privacy for Adaptive Weight Aggregation in Federated Tumor Segmentation	Aug 1, 2023	BenchmarkingBrain Tumor Segmentation	—Unverified
Complexity of Representations in Deep Learning	Sep 1, 2022	BenchmarkingDeep Learning	—Unverified
Diffusion-Driven Domain Adaptation for Generating 3D Molecules	Apr 1, 2024	BenchmarkingDecoder	—Unverified
DIG: A Turnkey Library for Diving into Graph Deep Learning Research	Mar 23, 2021	BenchmarkingDeep Learning	—Unverified
Complex Human Action Recognition in Live Videos Using Hybrid FR-DL Method	Jul 6, 2020	Action RecognitionArticles	—Unverified
Completing Spatial Transcriptomics Data for Gene Expression Prediction Benchmarking	May 5, 2025	BenchmarkingPrediction	—Unverified
DiLiGenT102: A Photometric Stereo Benchmark Dataset With Controlled Shape and Material Variation	Jan 1, 2022	Benchmarking	—Unverified

Show:10 25 50

← PrevPage 101 of 111Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified