Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3701–3750 of 5548 papers

Title	Date	Tasks	Status	Hype
Application of Machine Learning for Online Reputation Systems	Sep 10, 2022	BenchmarkingRecommendation Systems	—Unverified	0
FORLORN: A Framework for Comparing Offline Methods and Reinforcement Learning for Optimization of RAN Parameters	Sep 8, 2022	Benchmarkingcontinuous-control	CodeCode Available	0
Improving plant disease classification by adaptive minimal ensembling	Sep 8, 2022	BenchmarkingClassification	—Unverified	0
Benchmarking Multimodal Variational Autoencoders: CdSprites+ Dataset and Toolkit	Sep 7, 2022	Benchmarking	CodeCode Available	1
RF Fingerprinting Needs Attention: Multi-task Approach for Real-World WiFi and Bluetooth	Sep 7, 2022	Benchmarking	—Unverified	0
Low Complexity Hybrid Beamforming for mmWave Full-Duplex Integrated Access and Backhaul	Sep 5, 2022	Benchmarking	CodeCode Available	0
Structural Bias for Aspect Sentiment Triplet Extraction	Sep 2, 2022	Aspect Sentiment Triplet ExtractionBenchmarking	CodeCode Available	1
nnOOD: A Framework for Benchmarking Self-supervised Anomaly Localisation Methods	Sep 2, 2022	Anomaly DetectionBenchmarking	CodeCode Available	1
Complexity of Representations in Deep Learning	Sep 1, 2022	BenchmarkingDeep Learning	—Unverified	0
An evaluation framework for comparing causal inference models	Aug 31, 2022	BenchmarkingCausal Inference	—Unverified	0
AutoWS-Bench-101: Benchmarking Automated Weak Supervision with 100 Labels	Aug 30, 2022	Benchmarking	—Unverified	0
Hardware-aware mobile building block evaluation for computer vision	Aug 26, 2022	BenchmarkingEfficient Neural Network	—Unverified	0
Benchmarking Human Face Similarity Using Identical Twins	Aug 25, 2022	Benchmarking	—Unverified	0
TEP-GNN: Accurate Execution Time Prediction of Functional Tests using Graph Neural Networks	Aug 25, 2022	BenchmarkingGraph Neural Network	—Unverified	0
Towards Benchmarking Explainable Artificial Intelligence Methods	Aug 25, 2022	BenchmarkingExplainable artificial intelligence	—Unverified	0
Bugs in the Data: How ImageNet Misrepresents Biodiversity	Aug 24, 2022	BenchmarkingObject Detection	CodeCode Available	0
StEduCov: An Explored and Benchmarked Dataset on Stance Detection in Tweets towards Online Education during COVID-19 Pandemic	Aug 22, 2022	BenchmarkingStance Detection	—Unverified	0
MechProNet: Machine Learning Prediction of Mechanical Properties in Metal Additive Manufacturing	Aug 21, 2022	ArticlesBenchmarking	—Unverified	0
SIM2E: Benchmarking the Group Equivariant Capability of Correspondence Matching Algorithms	Aug 21, 2022	Benchmarking	—Unverified	0
A biologically-inspired multi-modal evaluation of molecular generative machine learning	Aug 20, 2022	BenchmarkingDrug Discovery	—Unverified	0
Wildfire Forecasting with Satellite Images and Deep Generative Model	Aug 19, 2022	BenchmarkingVideo Prediction	—Unverified	0
Benchmarking Compositionality with Formal Languages	Aug 17, 2022	BenchmarkingOpen-Ended Question Answering	CodeCode Available	1
MultiPL-E: A Scalable and Extensible Approach to Benchmarking Neural Code Generation	Aug 17, 2022	BenchmarkingCode Generation	CodeCode Available	2
The Low Emission Oil&Gas Open (LEOGO) Reference Platform of an Off-Grid Energy System for Renewable Integration Studies	Aug 16, 2022	BenchmarkingManagement	—Unverified	0
Unsupervised machine learning approach for building composite indicators with fuzzy metrics	Aug 15, 2022	Benchmarking	—Unverified	0
Sensitivity analysis and experimental evaluation of PID-like continuous sliding mode control	Aug 13, 2022	BenchmarkingSensitivity	—Unverified	0
Benchmarking Joint Face Spoofing and Forgery Detection with Visual and Physiological Cues	Aug 10, 2022	BenchmarkingDeepFake Detection	—Unverified	0
Exact lattice-based stochastic cell culture simulation algorithms incorporating spontaneous and contact-dependent reactions	Aug 9, 2022	BenchmarkingCultural Vocal Bursts Intensity Prediction	—Unverified	0
fMRI-S4: learning short- and long-range dynamic fMRI dependencies using 1D Convolutions and State Space Models	Aug 8, 2022	BenchmarkingState Space Models	CodeCode Available	0
QSAM-Net: Rain streak removal by quaternion neural network with self-attention module	Aug 8, 2022	Benchmarkingobject-detection	—Unverified	0
SOMPT22: A Surveillance Oriented Multi-Pedestrian Tracking Dataset	Aug 4, 2022	BenchmarkingMulti-Object Tracking	—Unverified	0
AstroVision: Towards Autonomous Feature Detection and Description for Missions to Small Bodies Using Deep Learning	Aug 3, 2022	Benchmarking	CodeCode Available	0
Benchmarking zero-shot and few-shot approaches for tokenization, tagging, and dependency parsing of Tagalog text	Aug 3, 2022	BenchmarkingData Augmentation	—Unverified	0
Binary Classification with Positive Labeling Sources	Aug 2, 2022	BenchmarkingBinary Classification	—Unverified	0
On the role of benchmarking data sets and simulations in method comparison studies	Aug 2, 2022	Benchmarking	—Unverified	0
CIPCaD-Bench: Continuous Industrial Process datasets for benchmarking Causal Discovery methods	Aug 2, 2022	BenchmarkingCausal Discovery	CodeCode Available	1
A Multifaceted Benchmarking of Synthetic Electronic Health Record Generation Models	Aug 2, 2022	BenchmarkingSynthetic Data Generation	CodeCode Available	1
ferret: a Framework for Benchmarking Explainers on Transformers	Aug 2, 2022	BenchmarkingExplainable Artificial Intelligence (XAI)	CodeCode Available	0
A Case for Dataset Specific Profiling	Aug 1, 2022	BenchmarkingModel Selection	—Unverified	0
Accelerated and interpretable oblique random survival forests	Aug 1, 2022	BenchmarkingComputational Efficiency	CodeCode Available	1
On the Evaluation of User Privacy in Deep Neural Networks using Timing Side Channel	Aug 1, 2022	Benchmarkingimage-classification	—Unverified	0
Benchmarking Visual-Inertial Deep Multimodal Fusion for Relative Pose Regression and Odometry-aided Absolute Pose Regression	Aug 1, 2022	Benchmarkingregression	—Unverified	0
Vector-Based Data Improves Left-Right Eye-Tracking Classifier Performance After a Covariate Distributional Shift	Jul 31, 2022	BenchmarkingEEG	CodeCode Available	0
PASTA: A Dataset for Modeling Participant States in Narratives	Jul 31, 2022	BenchmarkingCommon Sense Reasoning	—Unverified	0
Content-Aware Differential Privacy with Conditional Invertible Neural Networks	Jul 29, 2022	Benchmarking	CodeCode Available	0
Benchmarking Azerbaijani Neural Machine Translation	Jul 29, 2022	BenchmarkingDomain Generalization	—Unverified	0
Towards Large-Scale Small Object Detection: Survey and Benchmarks	Jul 28, 2022	BenchmarkingObject	—Unverified	0
Toward Transparent AI: A Survey on Interpreting the Inner Structures of Deep Neural Networks	Jul 27, 2022	Adversarial RobustnessBenchmarking	—Unverified	0
Tracking Every Thing in the Wild	Jul 26, 2022	BenchmarkingClassification	CodeCode Available	1
ArtFID: Quantitative Evaluation of Neural Style Transfer	Jul 25, 2022	BenchmarkingMeta-Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 75 of 111Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified