Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3126–3150 of 5548 papers

Title	Date	Tasks	Status
The Russian practice of applying cluster approach in regional development	Jun 8, 2021	Benchmarking	—Unverified
Investigating the Robustness and Properties of Detection Transformers (DETR) Toward Difficult Images	Oct 12, 2023	BenchmarkingDecoder	—Unverified
Benchmarking Robustness of Adaptation Methods on Pre-trained Vision-Language Models	Jun 3, 2023	Benchmarking	—Unverified
Investigating the Vision Transformer Model for Image Retrieval Tasks	Jan 11, 2021	BenchmarkingImage Retrieval	—Unverified
Benchmarking Robustness in Neural Radiance Fields	Jan 10, 2023	BenchmarkingCamera Calibration	—Unverified
The Principle of Unchanged Optimality in Reinforcement Learning Generalization	Jun 2, 2019	Benchmarkingreinforcement-learning	—Unverified
Invisible Stitch: Generating Smooth 3D Scenes with Depth Inpainting	Apr 30, 2024	BenchmarkingDepth Completion	—Unverified
Benchmarking Robustness and Generalization in Multi-Agent Systems: A Case Study on Neural MMO	Aug 30, 2023	BenchmarkingReinforcement Learning (RL)	—Unverified
Benchmarking Robot Manipulation with the Rubik's Cube	Feb 14, 2022	BenchmarkingRobot Manipulation	—Unverified
Benchmarking Retrieval-Augmented Large Language Models in Biomedical NLP: Application, Robustness, and Self-Awareness	May 13, 2024	Benchmarkingcounterfactual	—Unverified
The Seeker's Dilemma: Realistic Formulation and Benchmarking for Hardware Trojan Detection	Feb 27, 2024	Benchmarking	—Unverified
4Seasons: Benchmarking Visual SLAM and Long-Term Localization for Autonomous Driving in Challenging Conditions	Dec 31, 2022	Autonomous DrivingBenchmarking	—Unverified
IoT-LLM: Enhancing Real-World IoT Task Reasoning with Large Language Models	Oct 3, 2024	BenchmarkingIn-Context Learning	—Unverified
IO-VNBD: Inertial and Odometry Benchmark Dataset for Ground Vehicle Positioning	May 4, 2020	Autonomous VehiclesBenchmarking	—Unverified
The Sparsity Roofline: Understanding the Hardware Limits of Sparse Neural Networks	Sep 30, 2023	Benchmarking	—Unverified
Iris Liveness Detection Competition (LivDet-Iris) -- The 2020 Edition	Sep 1, 2020	Benchmarking	—Unverified
Is Bang-Bang Control All You Need? Solving Continuous Control with Bernoulli Policies	Nov 3, 2021	AllBenchmarking	—Unverified
Is Bio-Inspired Learning Better than Backprop? Benchmarking Bio Learning vs. Backprop	Dec 9, 2022	Benchmarking	—Unverified
Benchmarking Retrieval-Augmented Generation for Chemistry	May 12, 2025	BenchmarkingRAG	—Unverified
A Framework and Benchmarking Study for Counterfactual Generating Methods on Tabular Data	Jul 9, 2021	Benchmarkingcounterfactual	—Unverified
Evaluating Ising Processing Units with Integer Programming	Jul 2, 2017	Benchmarking	—Unverified
Benchmarking Resource Usage for Efficient Distributed Deep Learning	Jan 28, 2022	BenchmarkingDeep Learning	—Unverified
Benchmarking Reinforcement Learning Methods for Dexterous Robotic Manipulation with a Three-Fingered Gripper	Aug 27, 2024	BenchmarkingReinforcement Learning (RL)	—Unverified
ISLES'24: Improving final infarct prediction in ischemic stroke using multimodal imaging and clinical data	Aug 20, 2024	Benchmarking	—Unverified
Benchmarking Reasoning Robustness in Large Language Models	Mar 6, 2025	BenchmarkingMath	—Unverified

Show:10 25 50

← PrevPage 126 of 222Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified