Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3801–3850 of 5548 papers

Title	Date	Tasks	Status
Real-time Webcam Heart-Rate and Variability Estimation with Clean Ground Truth for Evaluation	Dec 31, 2020	BenchmarkingHeart Rate Variability	—Unverified
One-Shot Real-to-Sim via End-to-End Differentiable Simulation and Rendering	Nov 29, 2024	BenchmarkingObject	—Unverified
Real-World Blur Dataset for Learning and Benchmarking Deblurring Algorithms	Aug 1, 2020	BenchmarkingDeblurring	—Unverified
Real-World fNIRS-Based Brain-Computer Interfaces: Benchmarking Deep Learning and Classical Models in Interactive Gaming	May 15, 2025	BenchmarkingData Augmentation	—Unverified
Rearrangement: A Challenge for Embodied AI	Nov 3, 2020	Benchmarking	—Unverified
Reasoning as a Resource: Optimizing Fast and Slow Thinking in Code Generation Models	Jun 11, 2025	BenchmarkingCode Generation	—Unverified
Re-assessing ImageNet: How aligned is its single-label assumption with its multi-label nature?	Dec 24, 2024	Benchmarking	—Unverified
RECipe: Does a Multi-Modal Recipe Knowledge Graph Fit a Multi-Purpose Recommendation System?	Aug 8, 2023	BenchmarkingCollaborative Filtering	—Unverified
Recommendations for Baselines and Benchmarking Approximate Gaussian Processes	Feb 15, 2024	BenchmarkingGaussian Processes	—Unverified
Reconstructing antibody repertoires from error-prone immunosequencing datasets	Apr 24, 2017	Benchmarking	—Unverified
Reduced, Reused and Recycled: The Life of a Dataset in Machine Learning Research	Dec 3, 2021	BenchmarkingBIG-bench Machine Learning	—Unverified
Refer to Anything with Vision-Language Prompts	Jun 5, 2025	BenchmarkingGeneralized Referring Expression Segmentation	—Unverified
Regularization of ML models for Earth systems by using longer model timesteps	Mar 23, 2025	Benchmarking	—Unverified
Reinforcement Learning Based Handwritten Digit Recognition with Two-State Q-Learning	Jun 28, 2020	BenchmarkingHandwritten Digit Recognition	—Unverified
Reinforcement Learning with Graph Attention for Routing and Wavelength Assignment with Lightpath Reuse	Feb 20, 2025	BenchmarkingGraph Attention	—Unverified
Reinforcing Competitive Multi-Agents for Playing So Long Sucker	Nov 17, 2024	BenchmarkingDeep Reinforcement Learning	—Unverified
Relative Afferent Pupillary Defect Screening through Transfer Learning	Aug 6, 2019	BenchmarkingObject Recognition	—Unverified
Reliable validation of Reinforcement Learning Benchmarks	Mar 2, 2022	BenchmarkingData Compression	—Unverified
REMoH: A Reflective Evolution of Multi-objective Heuristics approach via Large Language Models	Jun 9, 2025	BenchmarkingDecision Making	—Unverified
Removal of Ocular Artifacts in EEG Using Deep Learning	Sep 24, 2022	BenchmarkingDeep Learning	—Unverified
Removing Multiple Hybrid Adverse Weather in Video via a Unified Model	Mar 8, 2025	BenchmarkingVideo Restoration	—Unverified
Rephrasing natural text data with different languages and quality levels for Large Language Model pre-training	Oct 28, 2024	BenchmarkingLanguage Modeling	—Unverified
REPLAB: A Reproducible Low-Cost Arm Benchmark Platform for Robotic Learning	May 17, 2019	BenchmarkingDeep Reinforcement Learning	—Unverified
Reproducible evaluation of classification methods in Alzheimer's disease: framework and application to MRI and PET data	Aug 20, 2018	BenchmarkingClassification	—Unverified
Repurposing Foundation Model for Generalizable Medical Time Series Classification	Oct 3, 2024	BenchmarkingDiagnostic	—Unverified
Reradiation and Scattering from a Reconfigurable Intelligent Surface: A General Macroscopic Model	Jul 27, 2021	Benchmarking	—Unverified
ResBench: Benchmarking LLM-Generated FPGA Designs with Resource Awareness	Mar 11, 2025	BenchmarkingCode Generation	—Unverified
ResearchArena: Benchmarking LLMs' Ability to Collect and Organize Information as Research Agents	Jun 13, 2024	BenchmarkingSurvey	—Unverified
ResearchBench: Benchmarking LLMs in Scientific Discovery via Inspiration-Based Task Decomposition	Mar 27, 2025	Benchmarkingscientific discovery	—Unverified
ResearchCodeAgent: An LLM Multi-Agent System for Automated Codification of Research Methodologies	Apr 28, 2025	BenchmarkingData Augmentation	—Unverified
ResearchCodeBench: Benchmarking LLMs on Implementing Novel Machine Learning Research Code	Jun 2, 2025	BenchmarkingCode Generation	—Unverified
Reservoir Computing with a Single Oscillating Gas Bubble: Emphasizing the Chaotic Regime	Mar 25, 2025	BenchmarkingLearning Theory	—Unverified
Resistive Neural Hardware Accelerators	Sep 8, 2021	Benchmarking	—Unverified
Resource-efficient Medical Image Analysis with Self-adapting Forward-Forward Networks	Jun 20, 2024	BenchmarkingMedical Image Analysis	—Unverified
RESPONSE: Benchmarking the Ability of Language Models to Undertake Commonsense Reasoning in Crisis Situation	Mar 14, 2025	Benchmarking	—Unverified
Restoring Images Captured in Arbitrary Hybrid Adverse Weather Conditions in One Go	May 17, 2023	BenchmarkingImage Restoration	—Unverified
Rethinking Pareto Frontier for Performance Evaluation of Deep Neural Networks	Feb 18, 2022	BenchmarkingDeep Learning	—Unverified
Retrieval-Augmented Generation for Service Discovery: Chunking Strategies and Benchmarking	May 25, 2025	BenchmarkingChunking	—Unverified
Dissecting Multimodality in VideoQA Transformer Models by Impairing Modality Fusion	Jun 15, 2023	Benchmarkingcounterfactual	—Unverified
Review and experimental benchmarking of machine learning algorithms for efficient optimization of cold atom experiments	Dec 20, 2023	Benchmarking	—Unverified
Reviewing and Benchmarking Parameter Control Methods in Differential Evolution	Oct 2, 2020	Benchmarking	—Unverified
Categorization and analysis of 14 computational methods for estimating cell potency from single-cell RNA-seq data	Sep 24, 2023	Benchmarking	—Unverified
Revisiting Implicit Models: Sparsity Trade-offs Capability in Weight-tied Model for Vision Tasks	Jul 16, 2023	Benchmarking	—Unverified
Revisiting Oxford and Paris: Large-Scale Image Retrieval Benchmarking	Mar 29, 2018	BenchmarkingImage Retrieval	—Unverified
Revisiting Safe Exploration in Safe Reinforcement learning	Sep 2, 2024	Benchmarkingreinforcement-learning	—Unverified
On the Evaluation and Refinement of Vision-Language Instruction Tuning Datasets	Oct 10, 2023	AllBenchmarking	—Unverified
Rewarding Episodic Visitation Discrepancy for Exploration in Reinforcement Learning	Sep 19, 2022	Atari GamesBenchmarking	—Unverified
RF Fingerprinting Needs Attention: Multi-task Approach for Real-World WiFi and Bluetooth	Sep 7, 2022	Benchmarking	—Unverified
Riemannian Geometry for the classification of brain states with intracortical brain-computer interfaces	Apr 7, 2025	BenchmarkingBrain Computer Interface	—Unverified
Riemannian Self-Attention Mechanism for SPD Networks	Nov 28, 2023	BenchmarkingRiemannian optimization	—Unverified

Show:10 25 50

← PrevPage 77 of 111Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified