Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4451–4475 of 5548 papers

Title	Date	Tasks	Status
Bi-Discriminator Class-Conditional Tabular GAN	Nov 12, 2021	Benchmarking	—Unverified
Benchmarking deep generative models for diverse antibody sequence design	Nov 12, 2021	BenchmarkingDiversity	—Unverified
ADCB: An Alzheimer's disease benchmark for evaluating observational estimators of causal effects	Nov 12, 2021	BenchmarkingCausal Inference	—Unverified
MLHarness: A Scalable Benchmarking System for MLCommons	Nov 9, 2021	Benchmarking	—Unverified
Practical, Fast and Robust Point Cloud Registration for 3D Scene Stitching and Object Localization	Nov 8, 2021	3D Feature MatchingBenchmarking	—Unverified
Characterizing the adversarial vulnerability of speech self-supervised learning	Nov 8, 2021	Adversarial RobustnessBenchmarking	—Unverified
EvoLearner: Learning Description Logics with Evolutionary Algorithms	Nov 8, 2021	BenchmarkingEvolutionary Algorithms	CodeCode Available
A new baseline for retinal vessel segmentation: Numerical identification and correction of methodological inconsistencies affecting 100+ papers	Nov 6, 2021	BenchmarkingRetinal Vessel Segmentation	CodeCode Available
Is Bang-Bang Control All You Need? Solving Continuous Control with Bernoulli Policies	Nov 3, 2021	AllBenchmarking	—Unverified
Virus-MNIST: Machine Learning Baseline Calculations for Image Classification	Nov 3, 2021	BenchmarkingBIG-bench Machine Learning	—Unverified
Procedural Generalization by Planning with Self-Supervised World Models	Nov 2, 2021	BenchmarkingMeta-Learning	—Unverified
Who’s on First?: Probing the Learning and Representation Capabilities of Language Models on Deterministic Closed Domains	Nov 1, 2021	BenchmarkingLanguage Modeling	CodeCode Available
Automatic Resolution of Domain Name Disputes	Nov 1, 2021	Benchmarking	CodeCode Available
Constructing a Psychometric Testbed for Fair Natural Language Processing	Nov 1, 2021	BenchmarkingFairness	CodeCode Available
Livestock Monitoring with Transformer	Nov 1, 2021	Action RecognitionBenchmarking	—Unverified
Distributing Deep Learning Hyperparameter Tuning for 3D Medical Image Segmentation	Oct 29, 2021	BenchmarkingBrain Tumor Segmentation	CodeCode Available
Towards a Taxonomy of Graph Learning Datasets	Oct 27, 2021	BenchmarkingGraph Learning	—Unverified
Identifying and Benchmarking Natural Out-of-Context Prediction Problems	Oct 25, 2021	Benchmarking	CodeCode Available
Which Model to Trust: Assessing the Influence of Models on the Performance of Reinforcement Learning Algorithms for Continuous Control Tasks	Oct 25, 2021	Benchmarkingcontinuous-control	CodeCode Available
Quantum Boosting using Domain-Partitioning Hypotheses	Oct 25, 2021	BenchmarkingEnsemble Learning	CodeCode Available
Scientific Machine Learning Benchmarks	Oct 25, 2021	BenchmarkingBIG-bench Machine Learning	—Unverified
Benchmarking of Lightweight Deep Learning Architectures for Skin Cancer Classification using ISIC 2017 Dataset	Oct 23, 2021	BenchmarkingCancer Classification	—Unverified
MLPerf HPC: A Holistic Benchmark Suite for Scientific Machine Learning on HPC Systems	Oct 21, 2021	BenchmarkingBIG-bench Machine Learning	—Unverified
Improved Multilingual Language Model Pretraining for Social Media Text via Translation Pair Prediction	Oct 20, 2021	BenchmarkingLanguage Modeling	CodeCode Available
An Open Natural Language Processing Development Framework for EHR-based Clinical Research: A case demonstration using the National COVID Cohort Collaborative (N3C)	Oct 20, 2021	Benchmarking	—Unverified

Show:10 25 50

← PrevPage 179 of 222Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified