Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3376–3400 of 5548 papers

Title	Date	Tasks	Status	Hype
Spam-T5: Benchmarking Large Language Models for Few-Shot Email Spam Detection	Apr 3, 2023	BenchmarkingSentence	CodeCode Available	1
ScandEval: A Benchmark for Scandinavian Natural Language Processing	Apr 3, 2023	BenchmarkingCross-Lingual Transfer	CodeCode Available	1
Vision-Language Models for Vision Tasks: A Survey	Apr 3, 2023	BenchmarkingKnowledge Distillation	CodeCode Available	4
A Latent Fingerprint in the Wild Database	Apr 3, 2023	Benchmarking	—Unverified	0
ENRICH: Multi-purposE dataset for beNchmaRking In Computer vision and pHotogrammetry	Apr 1, 2023	3D Reconstruction3D Scene Reconstruction	CodeCode Available	1
A Scale-Invariant Sorting Criterion to Find a Causal Order in Additive Noise Models	Mar 31, 2023	BenchmarkingCausal Discovery	CodeCode Available	1
What Makes for Effective Few-shot Point Cloud Classification?	Mar 31, 2023	BenchmarkingClassification	CodeCode Available	1
LaCViT: A Label-aware Contrastive Fine-tuning Framework for Vision Transformers	Mar 31, 2023	Benchmarkingimage-classification	CodeCode Available	0
Benchmarking FedAvg and FedCurv for Image Classification Tasks	Mar 31, 2023	BenchmarkingClassification	—Unverified	0
Why is the winner the best?	Mar 30, 2023	BenchmarkingMulti-Task Learning	—Unverified	0
Prediction of cancer driver genes and mutations: the potential of integrative computational frameworks	Mar 30, 2023	Benchmarking	—Unverified	0
ImageNet-E: Benchmarking Neural Network Robustness via Attribute Editing	Mar 30, 2023	AttributeBenchmarking	CodeCode Available	1
CodeGeeX: A Pre-Trained Model for Code Generation with Multilingual Benchmarking on HumanEval-X	Mar 30, 2023	BenchmarkingCode Generation	CodeCode Available	5
From Private to Public: Benchmarking GANs in the Context of Private Time Series Classification	Mar 28, 2023	BenchmarkingPrivacy Preserving	—Unverified	0
Open the box of digital neuromorphic processor: Towards effective algorithm-hardware co-design	Mar 27, 2023	BenchmarkingEdge-computing	—Unverified	0
Hyperparameter optimization, quantum-assisted model performance prediction, and benchmarking of AI-based High Energy Physics workloads using HPC	Mar 27, 2023	BenchmarkingHyperparameter Optimization	—Unverified	0
GeoNet: Benchmarking Unsupervised Adaptation across Geographies	Mar 27, 2023	BenchmarkingDomain Adaptation	—Unverified	0
Exploring Continual Learning of Diffusion Models	Mar 27, 2023	BenchmarkingContinual Learning	—Unverified	0
MGTBench: Benchmarking Machine-Generated Text Detection	Mar 26, 2023	BenchmarkingQuestion Answering	CodeCode Available	1
Balancing policy constraint and ensemble size in uncertainty-based offline reinforcement learning	Mar 26, 2023	Behavioural cloningBenchmarking	CodeCode Available	0
Benchmarking the Impact of Noise on Deep Learning-based Classification of Atrial Fibrillation in 12-Lead ECG	Mar 24, 2023	Atrial Fibrillation DetectionBenchmarking	—Unverified	0
Vulnerability of Face Morphing Attacks: A Case Study on Lookalike and Identical Twins	Mar 24, 2023	BenchmarkingFace Recognition	—Unverified	0
Benchmarking the Reliability of Post-training Quantization: a Particular Focus on Worst-case Performance	Mar 23, 2023	BenchmarkingData Augmentation	—Unverified	0
MEGA: Multilingual Evaluation of Generative AI	Mar 22, 2023	Benchmarking	CodeCode Available	1
Automated deep learning segmentation of high-resolution 7 T postmortem MRI for quantitative analysis of structure-pathology correlations in neurodegenerative diseases	Mar 21, 2023	AnatomyBenchmarking	CodeCode Available	0

Show:10 25 50

← PrevPage 136 of 222Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified