Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3701–3725 of 5548 papers

Title	Date	Tasks	Status	Hype
Application of Machine Learning for Online Reputation Systems	Sep 10, 2022	BenchmarkingRecommendation Systems	—Unverified	0
FORLORN: A Framework for Comparing Offline Methods and Reinforcement Learning for Optimization of RAN Parameters	Sep 8, 2022	Benchmarkingcontinuous-control	CodeCode Available	0
Improving plant disease classification by adaptive minimal ensembling	Sep 8, 2022	BenchmarkingClassification	—Unverified	0
Benchmarking Multimodal Variational Autoencoders: CdSprites+ Dataset and Toolkit	Sep 7, 2022	Benchmarking	CodeCode Available	1
RF Fingerprinting Needs Attention: Multi-task Approach for Real-World WiFi and Bluetooth	Sep 7, 2022	Benchmarking	—Unverified	0
Low Complexity Hybrid Beamforming for mmWave Full-Duplex Integrated Access and Backhaul	Sep 5, 2022	Benchmarking	CodeCode Available	0
Structural Bias for Aspect Sentiment Triplet Extraction	Sep 2, 2022	Aspect Sentiment Triplet ExtractionBenchmarking	CodeCode Available	1
nnOOD: A Framework for Benchmarking Self-supervised Anomaly Localisation Methods	Sep 2, 2022	Anomaly DetectionBenchmarking	CodeCode Available	1
Complexity of Representations in Deep Learning	Sep 1, 2022	BenchmarkingDeep Learning	—Unverified	0
An evaluation framework for comparing causal inference models	Aug 31, 2022	BenchmarkingCausal Inference	—Unverified	0
AutoWS-Bench-101: Benchmarking Automated Weak Supervision with 100 Labels	Aug 30, 2022	Benchmarking	—Unverified	0
Hardware-aware mobile building block evaluation for computer vision	Aug 26, 2022	BenchmarkingEfficient Neural Network	—Unverified	0
Benchmarking Human Face Similarity Using Identical Twins	Aug 25, 2022	Benchmarking	—Unverified	0
TEP-GNN: Accurate Execution Time Prediction of Functional Tests using Graph Neural Networks	Aug 25, 2022	BenchmarkingGraph Neural Network	—Unverified	0
Towards Benchmarking Explainable Artificial Intelligence Methods	Aug 25, 2022	BenchmarkingExplainable artificial intelligence	—Unverified	0
Bugs in the Data: How ImageNet Misrepresents Biodiversity	Aug 24, 2022	BenchmarkingObject Detection	CodeCode Available	0
StEduCov: An Explored and Benchmarked Dataset on Stance Detection in Tweets towards Online Education during COVID-19 Pandemic	Aug 22, 2022	BenchmarkingStance Detection	—Unverified	0
MechProNet: Machine Learning Prediction of Mechanical Properties in Metal Additive Manufacturing	Aug 21, 2022	ArticlesBenchmarking	—Unverified	0
SIM2E: Benchmarking the Group Equivariant Capability of Correspondence Matching Algorithms	Aug 21, 2022	Benchmarking	—Unverified	0
A biologically-inspired multi-modal evaluation of molecular generative machine learning	Aug 20, 2022	BenchmarkingDrug Discovery	—Unverified	0
Wildfire Forecasting with Satellite Images and Deep Generative Model	Aug 19, 2022	BenchmarkingVideo Prediction	—Unverified	0
Benchmarking Compositionality with Formal Languages	Aug 17, 2022	BenchmarkingOpen-Ended Question Answering	CodeCode Available	1
MultiPL-E: A Scalable and Extensible Approach to Benchmarking Neural Code Generation	Aug 17, 2022	BenchmarkingCode Generation	CodeCode Available	2
The Low Emission Oil&Gas Open (LEOGO) Reference Platform of an Off-Grid Energy System for Renewable Integration Studies	Aug 16, 2022	BenchmarkingManagement	—Unverified	0
Unsupervised machine learning approach for building composite indicators with fuzzy metrics	Aug 15, 2022	Benchmarking	—Unverified	0

Show:10 25 50

← PrevPage 149 of 222Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified