Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4401–4450 of 5548 papers

Title	Date	Tasks	Status
Beyond Emotion: A Multi-Modal Dataset for Human Desire Understanding	Jan 16, 2022	Benchmarking	—Unverified
A Survey on Masked Facial Detection Methods and Datasets for Fighting Against COVID-19	Jan 13, 2022	BenchmarkingLesion Segmentation	—Unverified
Benchmarking Deep Reinforcement Learning Algorithms for Vision-based Robotics	Jan 11, 2022	BenchmarkingDeep Reinforcement Learning	—Unverified
A Baseline Statistical Method For Robust User-Assisted Multiple Segmentation	Jan 8, 2022	BenchmarkingImage Segmentation	CodeCode Available
Aerial Scene Parsing: From Tile-level Scene Classification to Pixel-wise Semantic Labeling	Jan 6, 2022	Aerial Scene ClassificationBenchmarking	—Unverified
Standard Vs Uniform Binary Search and Their Variants in Learned Static Indexing: The Case of the Searching on Sorted Data Benchmarking Software Platform	Jan 5, 2022	Benchmarking	CodeCode Available
DiLiGenT102: A Photometric Stereo Benchmark Dataset With Controlled Shape and Material Variation	Jan 1, 2022	Benchmarking	—Unverified
MPCLeague: Robust MPC Platform for Privacy-Preserving Machine Learning	Dec 26, 2021	BenchmarkingBIG-bench Machine Learning	—Unverified
Benchmarking Pedestrian Odometry: The Brown Pedestrian Odometry Dataset (BPOD)	Dec 24, 2021	BenchmarkingPosition	—Unverified
TFW2V: An Enhanced Document Similarity Method for the Morphologically Rich Finnish Language	Dec 23, 2021	BenchmarkingClustering	CodeCode Available
InstaIndoor and Multi-modal Deep Learning for Indoor Scene Recognition	Dec 23, 2021	BenchmarkingDeep Learning	CodeCode Available
Evaluating the Robustness of Deep Reinforcement Learning for Autonomous Policies in a Multi-agent Urban Driving Environment	Dec 22, 2021	Autonomous DrivingBenchmarking	CodeCode Available
CORE: A Knowledge Graph Entity Type Prediction Method via Complex Space Regression and Embedding	Dec 19, 2021	BenchmarkingPrediction	—Unverified
QU-BraTS: MICCAI BraTS 2020 Challenge on Quantifying Uncertainty in Brain Tumor Segmentation - Analysis of Ranking Scores and Benchmarking Results	Dec 19, 2021	BenchmarkingBrain Tumor Segmentation	CodeCode Available
Personalized On-Device E-health Analytics with Decentralized Block Coordinate Descent	Dec 17, 2021	BenchmarkingDiagnostic	—Unverified
Logically at Factify 2022: Multimodal Fact Verification	Dec 16, 2021	BenchmarkingFact Checking	—Unverified
A Modular Workflow for Performance Benchmarking of Neuronal Network Simulations	Dec 16, 2021	Benchmarking	CodeCode Available
On the Use of Quality Diversity Algorithms for The Traveling Thief Problem	Dec 16, 2021	BenchmarkingDiversity	—Unverified
Benchmarking Safe Deep Reinforcement Learning in Aquatic Navigation	Dec 16, 2021	BenchmarkingDeep Reinforcement Learning	—Unverified
Benchmarking Uncertainty Quantification on Biosignal Classification Tasks under Dataset Shift	Dec 16, 2021	BenchmarkingClassification	—Unverified
On the Value of ML Models	Dec 13, 2021	Benchmarking	—Unverified
GUNNEL: Guided Mixup Augmentation and Multi-View Fusion for Aquatic Animal Segmentation	Dec 12, 2021	BenchmarkingInstance Segmentation	CodeCode Available
7th AI Driving Olympics: 1st Place Report for Panoptic Tracking	Dec 9, 2021	BenchmarkingPanoptic Segmentation	—Unverified
GreenPCO: An Unsupervised Lightweight Point Cloud Odometry Method	Dec 8, 2021	BenchmarkingObject	—Unverified
Reduced, Reused and Recycled: The Life of a Dataset in Machine Learning Research	Dec 3, 2021	BenchmarkingBIG-bench Machine Learning	—Unverified
Certified Adversarial Defenses Meet Out-of-Distribution Corruptions: Benchmarking Robustness and Simple Baselines	Dec 1, 2021	Adversarial RobustnessBenchmarking	—Unverified
Synthetic weather radar using hybrid quantum-classical machine learning	Nov 30, 2021	BenchmarkingBIG-bench Machine Learning	—Unverified
An implementation of the "Guess who?" game using CLIP	Nov 30, 2021	Benchmarking	CodeCode Available
Dyna-bAbI: unlocking bAbI's potential with dynamic synthetic benchmarking	Nov 30, 2021	BenchmarkingNatural Language Understanding	—Unverified
HRNET: AI on Edge for mask detection and social distancing	Nov 30, 2021	BenchmarkingEdge-computing	CodeCode Available
TinyML Platforms Benchmarking	Nov 30, 2021	Benchmarking	—Unverified
An in-depth experimental study of sensor usage and visual reasoning of robots navigating in real environments	Nov 29, 2021	BenchmarkingVisual Navigation	—Unverified
OOD-CV: A Benchmark for Robustness to Out-of-Distribution Shifts of Individual Nuisances in Natural Images	Nov 29, 2021	3D Pose EstimationBenchmarking	—Unverified
3D Compositional Zero-shot Learning with DeCompositional Consensus	Nov 29, 2021	BenchmarkingCompositional Zero-Shot Learning	—Unverified
EffCNet: An Efficient CondenseNet for Image Classification on NXP BlueBox	Nov 28, 2021	BenchmarkingClassification	—Unverified
Benchmarking Shadow Removal for Facial Landmark Detection and Beyond	Nov 27, 2021	BenchmarkingBlocking	—Unverified
Learning to Transfer for Traffic Forecasting via Multi-task Learning	Nov 27, 2021	BenchmarkingDomain Adaptation	CodeCode Available
Using Color To Identify Insider Threats	Nov 25, 2021	Benchmarking	CodeCode Available
A War Beyond Deepfake: Benchmarking Facial Counterfeits and Countermeasures	Nov 25, 2021	BenchmarkingDeepFake Detection	—Unverified
A Modular Framework for Centrality and Clustering in Complex Networks	Nov 23, 2021	BenchmarkingClustering	—Unverified
RadFusion: Benchmarking Performance and Fairness for Multimodal Pulmonary Embolism Detection from CT and EHR	Nov 23, 2021	BenchmarkingComputed Tomography (CT)	—Unverified
Filter Methods for Feature Selection in Supervised Machine Learning Applications -- Review and Benchmark	Nov 23, 2021	BenchmarkingBIG-bench Machine Learning	—Unverified
Novel Real-Time EMT-TS Modeling Architecture for Feeder Blackstart Simulations	Nov 19, 2021	Benchmarking	—Unverified
CLMB: deep contrastive learning for robust metagenomic binning	Nov 18, 2021	BenchmarkingContrastive Learning	CodeCode Available
Benchmarking Quality-Dependent and Cost-Sensitive Score-Level Multimodal Biometric Fusion Algorithms	Nov 17, 2021	Benchmarking	—Unverified
FewNLU: Benchmarking State-of-the-Art Methods for Few-Shot Natural Language Understanding	Nov 16, 2021	BenchmarkingNatural Language Understanding	—Unverified
MSAMSum: Towards Benchmarking Multi-lingual Dialogue Summarization	Nov 16, 2021	Benchmarkingdialogue summary	—Unverified
Fantastic Questions and Where to Find Them: FairytaleQA--An Authentic Dataset for Narrative Comprehension	Nov 16, 2021	BenchmarkingQuestion Answering	—Unverified
Mukayese: Turkish NLP Strikes Back	Nov 16, 2021	BenchmarkingLanguage Modeling	—Unverified
Multiclass Optimal Classification Trees with SVM-splits	Nov 16, 2021	BenchmarkingClassification	—Unverified

Show:10 25 50

← PrevPage 89 of 111Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified