Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4601–4650 of 5548 papers

Title	Date	Tasks	Status
Application of DEA in International Market Selection for the export of products from Spain	Sep 10, 2021	BenchmarkingDecision Making	—Unverified
ACI-BENCH: a Novel Ambient Clinical Intelligence Dataset for Benchmarking Automatic Visit Note Generation	Jun 3, 2023	Benchmarking	—Unverified
Application Inference using Machine Learning based Side Channel Analysis	Jul 9, 2019	BenchmarkingBIG-bench Machine Learning	—Unverified
Score-Based Generative Models for Molecule Generation	Mar 7, 2022	Benchmarking	—Unverified
SCPO: Safe Reinforcement Learning with Safety Critic Policy Optimization	Nov 1, 2023	Benchmarkingreinforcement-learning	—Unverified
Application based Evaluation of an Efficient Spike-Encoder, "Spiketrum"	May 24, 2024	BenchmarkingClassification	—Unverified
Applicability and Challenges of Deep Reinforcement Learning for Satellite Frequency Plan Design	Oct 15, 2020	BenchmarkingDecision Making	—Unverified
Apples to Apples: Learning Semantics of Common Entities Through a Novel Comprehension Task	Jul 1, 2017	BenchmarkingPart-Of-Speech Tagging	—Unverified
SDFR: Synthetic Data for Face Recognition Competition	Apr 6, 2024	BenchmarkingFace Recognition	—Unverified
A Platform for Event Extraction in Hindi	May 1, 2020	ArticlesBenchmarking	—Unverified
Uncertainty in GNN Learning Evaluations: The Importance of a Consistent Benchmark for Community Detection	May 10, 2023	BenchmarkingCommunity Detection	—Unverified
A Pipeline for Post-Crisis Twitter Data Acquisition	Jan 17, 2018	Active LearningBenchmarking	—Unverified
A Perspective on Neural Capacity Estimation: Viability and Reliability	Mar 22, 2022	BenchmarkingCapacity Estimation	—Unverified
SE Arena: An Interactive Platform for Evaluating Foundation Models in Software Engineering	Feb 3, 2025	BenchmarkingCode Generation	—Unverified
SeaTurtleID2022: A long-span dataset for reliable sea turtle re-identification	Nov 9, 2023	BenchmarkingInstance Segmentation	—Unverified
SeaTurtleID2022: A long-span dataset for reliable sea turtle re-identification	Nov 18, 2022	BenchmarkingInstance Segmentation	—Unverified
SecBench: A Comprehensive Multi-Dimensional Benchmarking Dataset for LLMs in Cybersecurity	Dec 30, 2024	BenchmarkingCode Generation	—Unverified
A Parallel Corpus for Evaluating Machine Translation between Arabic and European Languages	Apr 1, 2017	BenchmarkingMachine Translation	—Unverified
AnyTOD: A Programmable Task-Oriented Dialog System	Dec 20, 2022	BenchmarkingLanguage Modeling	—Unverified
SecRepoBench: Benchmarking LLMs for Secure Code Generation in Real-World Repositories	Apr 29, 2025	BenchmarkingCode Generation	—Unverified
Anytime Bi-Objective Optimization with a Hybrid Multi-Objective CMA-ES (HMO-CMA-ES)	May 9, 2016	Benchmarking	—Unverified
Secure Neuroimaging Analysis using Federated Learning with Homomorphic Encryption	Aug 7, 2021	BenchmarkingFederated Learning	—Unverified
Securing the Skies: A Comprehensive Survey on Anti-UAV Methods, Benchmarking, and Future Directions	Apr 16, 2025	BenchmarkingLanguage Modeling	—Unverified
Anytime Behavior of Inexact TSP Solvers and Perspectives for Automated Algorithm Selection	May 27, 2020	BenchmarkingCombinatorial Optimization	—Unverified
Any Image Restoration via Efficient Spatial-Frequency Degradation Adaptation	Apr 19, 2025	BenchmarkingImage Restoration	—Unverified
AntBO: Towards Real-World Automated Antibody Design with Combinatorial Bayesian Optimisation	Jan 29, 2022	Bayesian OptimisationBenchmarking	—Unverified
Ansatz-free Hamiltonian learning with Heisenberg-limited scaling	Feb 17, 2025	Benchmarking	—Unverified
Seeing in the Dark: Benchmarking Egocentric 3D Vision with the Oxford Day-and-Night Dataset	Jun 4, 2025	3D geometryBenchmarking	—Unverified
A Novel Momentum-Based Deep Learning Techniques for Medical Image Classification and Segmentation	Aug 11, 2024	Benchmarkingimage-classification	—Unverified
Seg2Reg: Differentiable 2D Segmentation to 1D Regression Rendering for 360 Room Layout Reconstruction	Nov 30, 2023	Benchmarkingregression	—Unverified
A Novel Hybrid Ordinal Learning Model with Health Care Application	Dec 15, 2023	BenchmarkingDiagnostic	—Unverified
Validation of neural spike sorting algorithms without ground-truth information	Aug 27, 2015	BenchmarkingSpike Sorting	—Unverified
Segmenting Maxillofacial Structures in CBCT Volumes	Jan 1, 2025	AnatomyBenchmarking	—Unverified
Segment Together: A Versatile Paradigm for Semi-Supervised Medical Image Segmentation	Nov 20, 2023	BenchmarkingImage Segmentation	—Unverified
SegXAL: Explainable Active Learning for Semantic Segmentation in Driving Scene Scenarios	Aug 8, 2024	Active LearningBenchmarking	—Unverified
Selecting Differential Splicing Methods: Practical Considerations	Sep 9, 2024	Benchmarking	—Unverified
A novel machine learning based framework for detection of Autism Spectrum Disorder (ASD)	Mar 27, 2019	BenchmarkingBIG-bench Machine Learning	—Unverified
Selective Shot Learning for Code Explanation	Dec 17, 2024	Benchmarking	—Unverified
Value-at-Risk-Based Portfolio Insurance: Performance Evaluation and Benchmarking Against CPPI in a Markov-Modulated Regime-Switching Market	May 21, 2023	BenchmarkingFinancial Analysis	—Unverified
A novel database of Children's Spontaneous Facial Expressions (LIRIS-CSE)	Dec 4, 2018	BenchmarkingFacial Expression Recognition	—Unverified
Self-supervised Benchmark Lottery on ImageNet: Do Marginal Improvements Translate to Improvements on Similar Datasets?	Jan 26, 2025	BenchmarkingSelf-Supervised Learning	—Unverified
Self-Supervised Speech Representation Learning: A Review	May 21, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
A Novel Cluster Detection of COVID-19 Patients and Medical Disease Conditions Using Improved Evolutionary Clustering Algorithm Star	Sep 20, 2021	BenchmarkingClustering	—Unverified
A Characterization Study of Arabic Twitter Data with a Benchmarking for State-of-the-Art Opinion Mining Models	Apr 1, 2017	BenchmarkingFeature Engineering	—Unverified
Semantic Segmentation using Vision Transformers: A survey	May 5, 2023	Autonomous DrivingBenchmarking	—Unverified
SemanticST: Spatially Informed Semantic Graph Learning for Clustering, Integration, and Scalable Analysis of Spatial Transcriptomics	Jun 13, 2025	BenchmarkingContrastive Learning	—Unverified
Semi and Weakly Supervised Semantic Segmentation Using Generative Adversarial Network	Mar 28, 2017	BenchmarkingClustering	—Unverified
Semi-implicit Continuous Newton Method for Power Flow Analysis	Dec 5, 2023	BenchmarkingNumerical Integration	—Unverified
A Novel Benchmarking Paradigm and a Scale- and Motion-Aware Model for Egocentric Pedestrian Trajectory Prediction	Oct 16, 2023	BenchmarkingPedestrian Trajectory Prediction	—Unverified
Towards Efficient Educational Chatbots: Benchmarking RAG Frameworks	Mar 2, 2025	BenchmarkingChatbot	—Unverified

Show:10 25 50

← PrevPage 93 of 111Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified