Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3051–3100 of 5548 papers

Title	Date	Tasks	Status
ImputeGAP: A Comprehensive Library for Time Series Imputation	Mar 19, 2025	BenchmarkingImputation	—Unverified
Benchmarking Table Comprehension In The Wild	Dec 13, 2024	BenchmarkingQuestion Answering	—Unverified
InAttention: Linear Context Scaling for Transformers	Oct 9, 2024	BenchmarkingDecoder	—Unverified
Inaugural MOASEI Competition at AAMAS'2025: A Technical Report	Jul 7, 2025	BenchmarkingDecision Making	—Unverified
INCLUSIFY: A benchmark and a model for gender-inclusive German	Dec 5, 2022	Benchmarking	—Unverified
The Partial Response Network: a neural network nomogram	Aug 16, 2019	Additive modelsBenchmarking	—Unverified
IndicMMLU-Pro: Benchmarking Indic Large Language Models on Multi-Task Language Understanding	Jan 27, 2025	BenchmarkingDiversity	—Unverified
IndicNLG Benchmark: Multilingual Datasets for Diverse NLG Tasks in Indic Languages	Mar 10, 2022	ArticlesBenchmarking	—Unverified
IndicSTR12: A Dataset for Indic Scene Text Recognition	Mar 12, 2024	BenchmarkingScene Text Recognition	—Unverified
Benchmarking Systematic Relational Reasoning with Large Language and Reasoning Models	Mar 30, 2025	BenchmarkingRelational Reasoning	—Unverified
A framework for benchmarking uncertainty in deep regression	Sep 10, 2021	Benchmarkingregression	—Unverified
Individual Treatment Effect Estimation Through Controlled Neural Network Training in Two Stages	Jan 21, 2022	BenchmarkingRepresentation Learning	—Unverified
The Pitfalls of Benchmarking in Algorithm Selection: What We Are Getting Wrong	May 12, 2025	Benchmarking	—Unverified
IndoLEM and IndoBERT: A Benchmark Dataset and Pre-trained Language Model for Indonesian NLP	Nov 2, 2020	BenchmarkingLanguage Modeling	—Unverified
Benchmarking symbolic regression constant optimization schemes	Dec 3, 2024	Benchmarkingregression	—Unverified
Benchmarking Surrogate-Assisted Genetic Recommender Systems	Aug 8, 2019	BenchmarkingEvolutionary Algorithms	—Unverified
Benchmarking Super-Resolution Algorithms on Real Data	Sep 8, 2017	BenchmarkingSuper-Resolution	—Unverified
Influence-Optimistic Local Values for Multiagent Planning --- Extended Version	Feb 18, 2015	BenchmarkingHeuristic Search	—Unverified
InfoDeepSeek: Benchmarking Agentic Information Seeking for Retrieval-Augmented Generation	May 21, 2025	BenchmarkingRAG	—Unverified
Benchmarking Sub-Genre Classification For Mainstage Dance Music	Sep 10, 2024	BenchmarkingClassification	—Unverified
InfoSEM: A Deep Generative Model with Informative Priors for Gene Regulatory Network Inference	Mar 6, 2025	Benchmarking	—Unverified
InfraLib: Enabling Reinforcement Learning and Decision-Making for Large-Scale Infrastructure Management	Sep 5, 2024	BenchmarkingComputational Efficiency	—Unverified
Benchmarking state-of-the-art gradient boosting algorithms for classification	May 26, 2023	Bayesian OptimizationBenchmarking	—Unverified
Benchmarking State-of-the-Art Deep Learning Software Tools	Aug 25, 2016	BenchmarkingCPU	—Unverified
Benchmarking Spiking Neural Network Learning Methods with Varying Locality	Feb 1, 2024	Benchmarking	—Unverified
Benchmarking sparse system identification with low-dimensional chaos	Feb 4, 2023	Benchmarking	—Unverified
InLUT3D: Challenging real indoor dataset for point cloud analysis	Jul 22, 2024	BenchmarkingScene Understanding	—Unverified
A Framework for Benchmarking Real-Time Embedded Object Detection	Apr 23, 2023	BenchmarkingObject	—Unverified
Benchmarking SMT Performance for Farsi Using the TEP++ Corpus	May 1, 2015	BenchmarkingMachine Translation	—Unverified
Benchmarking Smoothness and Reducing High-Frequency Oscillations in Continuous Control Policies	Oct 22, 2024	Benchmarkingcontinuous-control	—Unverified
In-situ process monitoring and adaptive quality enhancement in laser additive manufacturing: a critical review	Apr 21, 2024	BenchmarkingDecision Making	—Unverified
Benchmarking Single-Image Reflection Removal Algorithms	Oct 1, 2017	BenchmarkingReflection Removal	—Unverified
The Protein Engineering Tournament: An Open Science Benchmark for Protein Modeling and Design	Sep 18, 2023	Benchmarking	—Unverified
InstructEval: Systematic Evaluation of Instruction Selection Methods	Jul 1, 2023	BenchmarkingIn-Context Learning	—Unverified
Benchmarking simulated and physical quantum processing units using quantum and hybrid algorithms	Nov 28, 2022	Benchmarking	—Unverified
Benchmarking Shadow Removal for Facial Landmark Detection and Beyond	Nov 27, 2021	BenchmarkingBlocking	—Unverified
Benchmarking Sensitivity of Continual Graph Learning for Skeleton-Based Action Recognition	Jan 31, 2024	Action RecognitionBenchmarking	—Unverified
Integrated Benchmarking and Design for Reproducible and Accessible Evaluation of Robotic Agents	Sep 9, 2020	Benchmarking	—Unverified
Integrated Sensing and Communication enabled Multiple Base Stations Cooperative UAV Detection	Apr 19, 2024	BenchmarkingIntegrated sensing and communication	—Unverified
Integrated Super-resolution Sensing and Symbiotic Communication with 3D Sparse MIMO for Low-Altitude UAV Swarm	Apr 18, 2025	BenchmarkingSuper-Resolution	—Unverified
Integrating Dynamic Correlation Shifts and Weighted Benchmarking in Extreme Value Analysis	Nov 19, 2024	Benchmarking	—Unverified
Watchog: A Light-weight Contrastive Learning based Framework for Column Annotation	Dec 12, 2023	BenchmarkingColumns Property Annotation	—Unverified
Thermal Image-based Fault Diagnosis in Induction Machines via Self-Organized Operational Neural Networks	Dec 8, 2024	BenchmarkingDiagnostic	—Unverified
Integration of Regularized l1 Tracking and Instance Segmentation for Video Object Tracking	Dec 30, 2019	BenchmarkingInstance Segmentation	—Unverified
Intelligence at the Extreme Edge: A Survey on Reformable TinyML	Apr 2, 2022	BenchmarkingBIG-bench Machine Learning	—Unverified
Intelligent Railway Foreign Object Detection: A Semi-supervised Convolutional Autoencoder Based Method	Aug 5, 2021	BenchmarkingDecoder	—Unverified
A Large-Scale Analysis on Self-Supervised Video Representation Learning	Jun 9, 2023	BenchmarkingRepresentation Learning	—Unverified
InterAct: Advancing Large-Scale Versatile 3D Human-Object Interaction Generation	Jan 1, 2025	BenchmarkingHuman-Object Interaction Detection	—Unverified
Benchmarking Scientific Image Forgery Detectors	May 26, 2021	Benchmarking	—Unverified
Benchmarking Scene Text Recognition in Devanagari, Telugu and Malayalam	Apr 9, 2021	BenchmarkingScene Text Recognition	—Unverified

Show:10 25 50

← PrevPage 62 of 111Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified