Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5101–5125 of 5548 papers

Title	Date	Tasks	Status	Hype
Safe Trajectory Generation for Complex Urban Environments Using Spatio-temporal Semantic Corridor	Jun 24, 2019	Autonomous VehiclesBenchmarking	CodeCode Available	0
Alchemy: A Quantum Chemistry Dataset for Benchmarking AI Models	Jun 22, 2019	BenchmarkingBIG-bench Machine Learning	CodeCode Available	0
Exploring Model-based Planning with Policy Networks	Jun 20, 2019	Benchmarkingmodel	CodeCode Available	0
Energy Models for Better Pseudo-Labels: Improving Semi-Supervised Classification with the 1-Laplacian Graph Energy	Jun 20, 2019	BenchmarkingMulti-class Classification	—Unverified	0
Light Field Saliency Detection with Deep Convolutional Networks	Jun 19, 2019	BenchmarkingSaliency Detection	CodeCode Available	0
Performance Evaluation Methodology for Long-Term Visual Object Tracking	Jun 19, 2019	BenchmarkingObject	—Unverified	0
PyRobot: An Open-source Robotics Framework for Research and Benchmarking	Jun 19, 2019	BenchmarkingRobotic Grasping	CodeCode Available	1
Analysis \| OPEN \| Published: 17 June 2019 Multitask learning and benchmarking with clinical time series data	Jun 17, 2019	BenchmarkingBIG-bench Machine Learning	CodeCode Available	0
Benchmarking Neural Machine Translation for Southern African Languages	Jun 17, 2019	BenchmarkingMachine Translation	CodeCode Available	0
MMDetection: Open MMLab Detection Toolbox and Benchmark	Jun 17, 2019	BenchmarkingInstance Segmentation	CodeCode Available	1
Hardware Aware Neural Network Architectures using FbNet	Jun 17, 2019	BenchmarkingNeural Architecture Search	CodeCode Available	0
Transfer Learning in Biomedical Natural Language Processing: An Evaluation of BERT and ELMo on Ten Benchmarking Datasets	Jun 13, 2019	BenchmarkingDocument Classification	CodeCode Available	1
Benchmarking Minimax Linkage	Jun 7, 2019	BenchmarkingClustering	CodeCode Available	0
Object Pose Estimation in Robotics Revisited	Jun 6, 2019	3D Pose Estimation6D Pose Estimation	—Unverified	0
MNIST-C: A Robustness Benchmark for Computer Vision	Jun 5, 2019	Adversarial RobustnessBenchmarking	CodeCode Available	1
Towards Fair and Privacy-Preserving Federated Deep Models	Jun 4, 2019	BenchmarkingDeep Learning	CodeCode Available	0
RL-Based Method for Benchmarking the Adversarial Resilience and Robustness of Deep Reinforcement Learning Policies	Jun 3, 2019	BenchmarkingDeep Reinforcement Learning	—Unverified	0
Air Learning: A Deep Reinforcement Learning Gym for Autonomous Aerial Robot Visual Navigation	Jun 2, 2019	BenchmarkingDeep Reinforcement Learning	CodeCode Available	0
The Principle of Unchanged Optimality in Reinforcement Learning Generalization	Jun 2, 2019	Benchmarkingreinforcement-learning	—Unverified	0
Show Some Love to Your n-grams: A Bit of Progress and Stronger n-gram Language Modeling Baselines	Jun 1, 2019	BenchmarkingLanguage Modeling	—Unverified	0
Benchmarking Hierarchical Script Knowledge	Jun 1, 2019	Benchmarking	CodeCode Available	0
Natural Image Noise Dataset	Jun 1, 2019	BenchmarkingDenoising	CodeCode Available	0
MaxpoolNMS: Getting Rid of NMS Bottlenecks in Two-Stage Object Detectors	Jun 1, 2019	BenchmarkingGeneral Classification	—Unverified	0
Meta-Surrogate Benchmarking for Hyperparameter Optimization	May 30, 2019	BenchmarkingHyperparameter Optimization	CodeCode Available	1
Benchmarking Regression Methods: A comparison with CGAN	May 30, 2019	BenchmarkingInductive Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 205 of 222Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified