Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3051–3075 of 5548 papers

Title	Date	Tasks	Status
ImputeGAP: A Comprehensive Library for Time Series Imputation	Mar 19, 2025	BenchmarkingImputation	—Unverified
Benchmarking Table Comprehension In The Wild	Dec 13, 2024	BenchmarkingQuestion Answering	—Unverified
InAttention: Linear Context Scaling for Transformers	Oct 9, 2024	BenchmarkingDecoder	—Unverified
Inaugural MOASEI Competition at AAMAS'2025: A Technical Report	Jul 7, 2025	BenchmarkingDecision Making	—Unverified
INCLUSIFY: A benchmark and a model for gender-inclusive German	Dec 5, 2022	Benchmarking	—Unverified
The Partial Response Network: a neural network nomogram	Aug 16, 2019	Additive modelsBenchmarking	—Unverified
IndicMMLU-Pro: Benchmarking Indic Large Language Models on Multi-Task Language Understanding	Jan 27, 2025	BenchmarkingDiversity	—Unverified
IndicNLG Benchmark: Multilingual Datasets for Diverse NLG Tasks in Indic Languages	Mar 10, 2022	ArticlesBenchmarking	—Unverified
IndicSTR12: A Dataset for Indic Scene Text Recognition	Mar 12, 2024	BenchmarkingScene Text Recognition	—Unverified
Benchmarking Systematic Relational Reasoning with Large Language and Reasoning Models	Mar 30, 2025	BenchmarkingRelational Reasoning	—Unverified
A framework for benchmarking uncertainty in deep regression	Sep 10, 2021	Benchmarkingregression	—Unverified
Individual Treatment Effect Estimation Through Controlled Neural Network Training in Two Stages	Jan 21, 2022	BenchmarkingRepresentation Learning	—Unverified
The Pitfalls of Benchmarking in Algorithm Selection: What We Are Getting Wrong	May 12, 2025	Benchmarking	—Unverified
IndoLEM and IndoBERT: A Benchmark Dataset and Pre-trained Language Model for Indonesian NLP	Nov 2, 2020	BenchmarkingLanguage Modeling	—Unverified
Benchmarking symbolic regression constant optimization schemes	Dec 3, 2024	Benchmarkingregression	—Unverified
Benchmarking Surrogate-Assisted Genetic Recommender Systems	Aug 8, 2019	BenchmarkingEvolutionary Algorithms	—Unverified
Benchmarking Super-Resolution Algorithms on Real Data	Sep 8, 2017	BenchmarkingSuper-Resolution	—Unverified
Influence-Optimistic Local Values for Multiagent Planning --- Extended Version	Feb 18, 2015	BenchmarkingHeuristic Search	—Unverified
InfoDeepSeek: Benchmarking Agentic Information Seeking for Retrieval-Augmented Generation	May 21, 2025	BenchmarkingRAG	—Unverified
Benchmarking Sub-Genre Classification For Mainstage Dance Music	Sep 10, 2024	BenchmarkingClassification	—Unverified
InfoSEM: A Deep Generative Model with Informative Priors for Gene Regulatory Network Inference	Mar 6, 2025	Benchmarking	—Unverified
InfraLib: Enabling Reinforcement Learning and Decision-Making for Large-Scale Infrastructure Management	Sep 5, 2024	BenchmarkingComputational Efficiency	—Unverified
Benchmarking state-of-the-art gradient boosting algorithms for classification	May 26, 2023	Bayesian OptimizationBenchmarking	—Unverified
Benchmarking State-of-the-Art Deep Learning Software Tools	Aug 25, 2016	BenchmarkingCPU	—Unverified
Benchmarking Spiking Neural Network Learning Methods with Varying Locality	Feb 1, 2024	Benchmarking	—Unverified

Show:10 25 50

← PrevPage 123 of 222Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified