Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3501–3525 of 5548 papers

Title	Date	Tasks	Status
NEXT-EVAL: Next Evaluation of Traditional and LLM Web Data Record Extraction	May 21, 2025	BenchmarkingHallucination	—Unverified
Next-generation MRD assays: do we have the tools to evaluate them properly?	Oct 31, 2023	BenchmarkingSensitivity	—Unverified
NL2KQL: From Natural Language to Kusto Query	Apr 3, 2024	BenchmarkingNatural Language Queries	—Unverified
Benchmarking and Building Zero-Shot Hindi Retrieval Model with Hindi-BEIR and NLLB-E5	Sep 9, 2024	BenchmarkingInformation Retrieval	—Unverified
NLPre: a revised approach towards language-centric benchmarking of Natural Language Preprocessing systems	Mar 7, 2024	BenchmarkingDependency Parsing	—Unverified
No Dataset Needed for Downstream Knowledge Benchmarking: Response Dispersion Inversely Correlates with Accuracy on Domain-specific QA	Aug 24, 2024	BenchmarkingChatbot	—Unverified
NODDI-SH: a computational efficient NODDI extension for fODF estimation in diffusion MRI	Aug 28, 2017	BenchmarkingDiffusion MRI	—Unverified
Node Classification Meets Link Prediction on Knowledge Graphs	Jun 14, 2021	BenchmarkingClassification	—Unverified
Nodule detection and generation on chest X-rays: NODE21 Challenge	Jan 4, 2024	Benchmarking	—Unverified
NoisyEQA: Benchmarking Embodied Question Answering Against Noisy Queries	Dec 14, 2024	BenchmarkingEmbodied Question Answering	—Unverified
NoisyHate: Mining Online Human-Written Perturbations for Realistic Robustness Benchmarking of Content Moderation Models	Mar 18, 2023	Adversarial AttackBenchmarking	—Unverified
Noisy intermediate-scale quantum (NISQ) algorithms	Jan 21, 2021	BenchmarkingCombinatorial Optimization	—Unverified
InferBench: Understanding Deep Learning Inference Serving with an Automatic Benchmarking System	Nov 4, 2020	Benchmarking	—Unverified
Non-Contextual Modeling of Sarcasm using a Neural Network Benchmark	Nov 20, 2017	BenchmarkingSentiment Analysis	—Unverified
Non-Reference Quality Assessment for Medical Imaging: Application to Synthetic Brain MRIs	Jul 20, 2024	BenchmarkingDomain Adaptation	—Unverified
Nonstochastic Bandits with Infinitely Many Experts	Feb 9, 2021	BenchmarkingMeta-Learning	—Unverified
NoTeS-Bank: Benchmarking Neural Transcription and Search for Scientific Notes Understanding	Apr 12, 2025	BenchmarkingDocument AI	—Unverified
Not Every Tree Is a Forest: Benchmarking Forest Types from Satellite Remote Sensing	May 3, 2025	BenchmarkingImage Segmentation	—Unverified
NOTSOFAR-1 Challenge: New Datasets, Baseline, and Tasks for Distant Meeting Transcription	Jan 16, 2024	Automatic Speech RecognitionBenchmarking	—Unverified
NOVA: A Benchmark for Anomaly Localization and Clinical Reasoning in Brain MRI	May 20, 2025	Anomaly LocalizationBenchmarking	—Unverified
NovelGym: A Flexible Ecosystem for Hybrid Planning and Learning Agents Designed for Open Worlds	Jan 7, 2024	Autonomous VehiclesBenchmarking	—Unverified
Long Short-Term Memory with Gate and State Level Fusion for Light Field-Based Face Recognition	May 11, 2019	BenchmarkingFace Recognition	—Unverified
Novel Real-Time EMT-TS Modeling Architecture for Feeder Blackstart Simulations	Nov 19, 2021	Benchmarking	—Unverified
NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics	Jun 16, 2024	Benchmarkingde novo peptide sequencing	—Unverified
Now you see me: evaluating performance in long-term visual tracking	Apr 19, 2018	BenchmarkingVisual Tracking	—Unverified

Show:10 25 50

← PrevPage 141 of 222Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified