Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4401–4450 of 5548 papers

Title	Date	Tasks	Status	Hype
Real Time Egocentric Object Segmentation: THU-READ Labeling and Benchmarking Results	Jun 9, 2021	BenchmarkingMixed Reality	—Unverified	0
The Russian practice of applying cluster approach in regional development	Jun 8, 2021	Benchmarking	—Unverified	0
EXPObench: Benchmarking Surrogate-based Optimisation Algorithms on Expensive Black-box Functions	Jun 8, 2021	Bayesian OptimisationBenchmarking	CodeCode Available	1
The Medkit-Learn(ing) Environment: Medical Decision Modelling through Simulation	Jun 8, 2021	BenchmarkingDecision Making	CodeCode Available	1
A critical look at the current train/test split in machine learning	Jun 8, 2021	Active LearningBenchmarking	—Unverified	0
RobustNav: Towards Benchmarking Robustness in Embodied Navigation	Jun 8, 2021	BenchmarkingData Augmentation	CodeCode Available	1
On the use of automatically generated synthetic image datasets for benchmarking face recognition	Jun 8, 2021	BenchmarkingFace Recognition	CodeCode Available	0
Benchmarking Bias Mitigation Algorithms in Representation Learning through Fairness Metrics	Jun 8, 2021	Age And Gender ClassificationBenchmarking	CodeCode Available	1
A Benchmarking Protocol for Pansharpening: Dataset, Preprocessing, and Quality Assessment	Jun 7, 2021	BenchmarkingPansharpening	—Unverified	0
Can a single neuron learn predictive uncertainty?	Jun 7, 2021	BenchmarkingConformal Prediction	CodeCode Available	0
Predicting Quantum Potentials by Deep Neural Network and Metropolis Sampling	Jun 6, 2021	Benchmarking	—Unverified	0
On Training Sample Memorization: Lessons from Benchmarking Generative Modeling with a Large-scale Competition	Jun 6, 2021	BenchmarkingMemorization	CodeCode Available	0
Tetrad: Actively Secure 4PC for Secure Training and Inference	Jun 5, 2021	BenchmarkingFairness	—Unverified	0
Top-k Regularization for Supervised Feature Selection	Jun 4, 2021	Benchmarkingfeature selection	—Unverified	0
Adaptive Epidemic Forecasting and Community Risk Evaluation of COVID-19	Jun 3, 2021	BenchmarkingDecision Making	—Unverified	0
Comprehensive Energy Footprint Benchmarking Algorithm for Electrified Powertrains	Jun 2, 2021	Benchmarkingenergy management	—Unverified	0
DFGC 2021: A DeepFake Game Competition	Jun 2, 2021	BenchmarkingDeepFake Detection	CodeCode Available	1
Benchmarking CNN on 3D Anatomical Brain MRI: Architectures, Data Augmentation and Deep Ensemble Learning	Jun 2, 2021	BenchmarkingData Augmentation	—Unverified	0
OctoPath: An OcTree Based Self-Supervised Learning Approach to Local Trajectory Planning for Mobile Robots	Jun 2, 2021	BenchmarkingDecoder	—Unverified	0
Knowledge-Driven Slot Constraints for Goal-Oriented Dialogue Systems	Jun 1, 2021	BenchmarkingGoal-Oriented Dialogue Systems	CodeCode Available	0
Comprehensive Energy Footprint Benchmarking of Strong Parallel Electrified Powertrain	Jun 1, 2021	Benchmarkingenergy management	—Unverified	0
Cash versus Kind: Benchmarking a Child Nutrition Program against Unconditional Cash Transfers in Rwanda	Jun 1, 2021	BenchmarkingDiversity	—Unverified	0
Procedural Content Generation: Better Benchmarks for Transfer Reinforcement Learning	May 31, 2021	BenchmarkingDeep Learning	—Unverified	0
A General Taylor Framework for Unifying and Revisiting Attribution Methods	May 28, 2021	BenchmarkingDecision Making	—Unverified	0
Benchmarking Scientific Image Forgery Detectors	May 26, 2021	Benchmarking	—Unverified	0
Speed Benchmarking of Genetic Programming Frameworks	May 25, 2021	Benchmarking	—Unverified	0
FedScale: Benchmarking Model and System Performance of Federated Learning at Scale	May 24, 2021	BenchmarkingFederated Learning	CodeCode Available	1
Benchmarking the Performance of Bayesian Optimization across Multiple Experimental Materials Science Domains	May 23, 2021	Active LearningBayesian Optimisation	CodeCode Available	1
Dynaboard: An Evaluation-As-A-Service Platform for Holistic Next-Generation Benchmarking	May 21, 2021	Benchmarking	—Unverified	0
Helsinki Deblur Challenge 2021: description of photographic data	May 21, 2021	BenchmarkingDeblurring	—Unverified	0
Anabranch Network for Camouflaged Object Segmentation	May 20, 2021	BenchmarkingCamouflaged Object Segmentation	CodeCode Available	1
Laughing Heads: Can Transformers Detect What Makes a Sentence Funny?	May 19, 2021	BenchmarkingSentence	CodeCode Available	0
Multimodal Fusion via Teacher-Student Network for Indoor Action Recognition	May 18, 2021	Action RecognitionAction Recognition In Videos	CodeCode Available	1
DACBench: A Benchmark Library for Dynamic Algorithm Configuration	May 18, 2021	Benchmarking	CodeCode Available	1
Global Wheat Head Dataset 2021: more diversity to improve the benchmarking of wheat head localization methods	May 17, 2021	BenchmarkingDiversity	—Unverified	0
Quantifying the Impact of Boundary Constraint Handling Methods on Differential Evolution	May 14, 2021	Benchmarking	—Unverified	0
Sanity Simulations for Saliency Methods	May 13, 2021	Benchmarking	CodeCode Available	0
Best practices for constructing, preparing, and evaluating protein-ligand binding affinity benchmarks	May 13, 2021	BenchmarkingDrug Discovery	CodeCode Available	1
A Reinforcement Learning Environment for Multi-Service UAV-enabled Wireless Systems	May 11, 2021	BenchmarkingEdge-computing	CodeCode Available	1
Benchmarking down-scaled (not so large) pre-trained language models	May 11, 2021	Benchmarking	CodeCode Available	0
Examining convolutional feature extraction using Maximum Entropy (ME) and Signal-to-Noise Ratio (SNR) for image classification	May 10, 2021	Benchmarkingimage-classification	—Unverified	0
CREPO: An Open Repository to Benchmark Credal Network Algorithms	May 10, 2021	Benchmarking	CodeCode Available	0
Towards Benchmarking the Utility of Explanations for Model Debugging	May 10, 2021	Benchmarking	—Unverified	0
Beyond Monocular Deraining: Parallel Stereo Deraining Network Via Semantic Prior	May 9, 2021	BenchmarkingRain Removal	—Unverified	0
MS MARCO: Benchmarking Ranking Models in the Large-Data Regime	May 9, 2021	Benchmarking	—Unverified	0
D2S: Document-to-Slide Generation Via Query-Based Text Summarization	May 8, 2021	BenchmarkingLong Form Question Answering	CodeCode Available	1
Covariance Matrix Adaptation Evolution Strategy Assisted by Principal Component Analysis	May 8, 2021	BenchmarkingDimensionality Reduction	—Unverified	0
AnomalyHop: An SSL-based Image Anomaly Localization Method	May 8, 2021	Anomaly LocalizationBenchmarking	CodeCode Available	1
Building and benchmarking an Arabic Speech Commands dataset for small-footprint keyword spotting	May 7, 2021	BenchmarkingDeep Learning	CodeCode Available	0
Open Radar Initiative: Large Scale Dataset for Benchmarking of micro-Doppler Recognition Algorithms	May 7, 2021	Benchmarking	CodeCode Available	1

Show:10 25 50

← PrevPage 89 of 111Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified