Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5101–5150 of 5548 papers

Title	Date	Tasks	Status	Hype
Safe Trajectory Generation for Complex Urban Environments Using Spatio-temporal Semantic Corridor	Jun 24, 2019	Autonomous VehiclesBenchmarking	CodeCode Available	0
Alchemy: A Quantum Chemistry Dataset for Benchmarking AI Models	Jun 22, 2019	BenchmarkingBIG-bench Machine Learning	CodeCode Available	0
Exploring Model-based Planning with Policy Networks	Jun 20, 2019	Benchmarkingmodel	CodeCode Available	0
Energy Models for Better Pseudo-Labels: Improving Semi-Supervised Classification with the 1-Laplacian Graph Energy	Jun 20, 2019	BenchmarkingMulti-class Classification	—Unverified	0
Light Field Saliency Detection with Deep Convolutional Networks	Jun 19, 2019	BenchmarkingSaliency Detection	CodeCode Available	0
Performance Evaluation Methodology for Long-Term Visual Object Tracking	Jun 19, 2019	BenchmarkingObject	—Unverified	0
PyRobot: An Open-source Robotics Framework for Research and Benchmarking	Jun 19, 2019	BenchmarkingRobotic Grasping	CodeCode Available	1
Analysis \| OPEN \| Published: 17 June 2019 Multitask learning and benchmarking with clinical time series data	Jun 17, 2019	BenchmarkingBIG-bench Machine Learning	CodeCode Available	0
Benchmarking Neural Machine Translation for Southern African Languages	Jun 17, 2019	BenchmarkingMachine Translation	CodeCode Available	0
MMDetection: Open MMLab Detection Toolbox and Benchmark	Jun 17, 2019	BenchmarkingInstance Segmentation	CodeCode Available	1
Hardware Aware Neural Network Architectures using FbNet	Jun 17, 2019	BenchmarkingNeural Architecture Search	CodeCode Available	0
Transfer Learning in Biomedical Natural Language Processing: An Evaluation of BERT and ELMo on Ten Benchmarking Datasets	Jun 13, 2019	BenchmarkingDocument Classification	CodeCode Available	1
Benchmarking Minimax Linkage	Jun 7, 2019	BenchmarkingClustering	CodeCode Available	0
Object Pose Estimation in Robotics Revisited	Jun 6, 2019	3D Pose Estimation6D Pose Estimation	—Unverified	0
MNIST-C: A Robustness Benchmark for Computer Vision	Jun 5, 2019	Adversarial RobustnessBenchmarking	CodeCode Available	1
Towards Fair and Privacy-Preserving Federated Deep Models	Jun 4, 2019	BenchmarkingDeep Learning	CodeCode Available	0
RL-Based Method for Benchmarking the Adversarial Resilience and Robustness of Deep Reinforcement Learning Policies	Jun 3, 2019	BenchmarkingDeep Reinforcement Learning	—Unverified	0
Air Learning: A Deep Reinforcement Learning Gym for Autonomous Aerial Robot Visual Navigation	Jun 2, 2019	BenchmarkingDeep Reinforcement Learning	CodeCode Available	0
The Principle of Unchanged Optimality in Reinforcement Learning Generalization	Jun 2, 2019	Benchmarkingreinforcement-learning	—Unverified	0
Show Some Love to Your n-grams: A Bit of Progress and Stronger n-gram Language Modeling Baselines	Jun 1, 2019	BenchmarkingLanguage Modeling	—Unverified	0
Benchmarking Hierarchical Script Knowledge	Jun 1, 2019	Benchmarking	CodeCode Available	0
Natural Image Noise Dataset	Jun 1, 2019	BenchmarkingDenoising	CodeCode Available	0
MaxpoolNMS: Getting Rid of NMS Bottlenecks in Two-Stage Object Detectors	Jun 1, 2019	BenchmarkingGeneral Classification	—Unverified	0
Meta-Surrogate Benchmarking for Hyperparameter Optimization	May 30, 2019	BenchmarkingHyperparameter Optimization	CodeCode Available	1
Benchmarking Regression Methods: A comparison with CGAN	May 30, 2019	BenchmarkingInductive Learning	CodeCode Available	1
Non-linear Multitask Learning with Deep Gaussian Processes	May 29, 2019	BenchmarkingGaussian Processes	—Unverified	0
Matrix-Free Preconditioning in Online Learning	May 29, 2019	Benchmarking	—Unverified	0
Adaptive Deep Kernel Learning	May 28, 2019	BenchmarkingDrug Discovery	—Unverified	0
COSET: A Benchmark for Evaluating Neural Program Embeddings	May 27, 2019	BenchmarkingGraph Neural Network	—Unverified	0
On Recurrent Neural Networks for Sequence-based Processing in Communications	May 24, 2019	BenchmarkingDecoder	CodeCode Available	0
NTP : A Neural Network Topology Profiler	May 22, 2019	BenchmarkingQuantization	—Unverified	0
Cognitive Model Priors for Predicting Human Decisions	May 22, 2019	BenchmarkingBIG-bench Machine Learning	—Unverified	0
Benchmarking Deep Learning Architectures for Predicting Readmission to the ICU and Describing Patients-at-Risk	May 21, 2019	Bayesian InferenceBenchmarking	CodeCode Available	0
Characterizing SLAM Benchmarks and Methods for the Robust Perception Age	May 19, 2019	Benchmarking	CodeCode Available	0
Robust measurement of innovation performances in Europe with a hierarchy of interacting composite indicators	May 18, 2019	BenchmarkingDecision Making	—Unverified	0
SAWNet: A Spatially Aware Deep Neural Network for 3D Point Cloud Processing	May 18, 2019	BenchmarkingScene Segmentation	—Unverified	0
REPLAB: A Reproducible Low-Cost Arm Benchmark Platform for Robotic Learning	May 17, 2019	BenchmarkingDeep Reinforcement Learning	—Unverified	0
LEAF: A Benchmark for Federated Settings	May 16, 2019	Autonomous VehiclesBenchmarking	—Unverified	0
Simitate: A Hybrid Imitation Learning Benchmark	May 15, 2019	BenchmarkingImitation Learning	CodeCode Available	0
IPC: A Benchmark Data Set for Learning with Graph-Structured Data	May 15, 2019	BenchmarkingGraph Classification	CodeCode Available	0
Strong and Simple Baselines for Multimodal Utterance Embeddings	May 14, 2019	Benchmarking	CodeCode Available	0
The Algonauts Project: A Platform for Communication between the Sciences of Biological and Artificial Intelligence	May 14, 2019	Benchmarkingspeech-recognition	—Unverified	0
VizNet: Towards A Large-Scale Visualization Learning and Benchmarking Repository	May 12, 2019	Benchmarking	CodeCode Available	0
Long Short-Term Memory with Gate and State Level Fusion for Light Field-Based Face Recognition	May 11, 2019	BenchmarkingFace Recognition	—Unverified	0
Machine Learning Cryptanalysis of a Quantum Random Number Generator	May 7, 2019	BenchmarkingBIG-bench Machine Learning	CodeCode Available	0
Scaling and Benchmarking Self-Supervised Visual Representation Learning	May 3, 2019	Benchmarkingobject-detection	CodeCode Available	0
Detecting Out-Of-Distribution Samples Using Low-Order Deep Features Statistics	May 1, 2019	Benchmarking	—Unverified	0
Evaluation Methodology for Attacks Against Confidence Thresholding Models	May 1, 2019	Adversarial RobustnessBenchmarking	—Unverified	0
On the Use of ArXiv as a Dataset	Apr 30, 2019	ArticlesAuthor Attribution	CodeCode Available	0
A Deep Q-Learning Method for Downlink Power Allocation in Multi-Cell Networks	Apr 30, 2019	BenchmarkingDeep Reinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 103 of 111Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified