Benchmarking

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4176–4200 of 5548 papers

Title	Date	Tasks	Status
Towards an AI Accountability Policy	Jul 25, 2023	BenchmarkingFairness	—Unverified
Towards an Automated SOAP Note: Classifying Utterances from Medical Conversations	Jul 17, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Towards a Taxonomy of Graph Learning Datasets	Oct 27, 2021	BenchmarkingGraph Learning	—Unverified
Towards a Theory-Guided Benchmarking Suite for Discrete Black-Box Optimization Heuristics: Profiling (1+λ) EA Variants on OneMax and LeadingOnes	Aug 17, 2018	BenchmarkingEvolutionary Algorithms	—Unverified
Towards a Unified Framework for Determining Conformational Ensembles of Disordered Proteins	Apr 4, 2025	Benchmarking	—Unverified
Towards Benchmarking and Assessing the Safety and Robustness of Autonomous Driving on Safety-critical Scenarios	Mar 31, 2025	Adversarial AttackAutonomous Driving	—Unverified
Towards Benchmarking and Evaluating Deepfake Detection	Mar 4, 2022	BenchmarkingDeepFake Detection	—Unverified
Towards Benchmarking Explainable Artificial Intelligence Methods	Aug 25, 2022	BenchmarkingExplainable artificial intelligence	—Unverified
Towards Benchmarking Scene Background Initialization	Jun 12, 2015	Benchmarking	—Unverified
Towards Benchmarking the Utility of Explanations for Model Debugging	May 10, 2021	Benchmarking	—Unverified
Towards Class-agnostic Tracking Using Feature Decorrelation in Point Clouds	Feb 28, 2022	BenchmarkingObject Tracking	—Unverified
Towards Effective Disambiguation for Machine Translation with Large Language Models	Sep 20, 2023	BenchmarkingIn-Context Learning	—Unverified
Towards Efficient Multi-LLM Inference: Characterization and Analysis of LLM Routing and Hierarchical Techniques	Jun 6, 2025	BenchmarkingModel Selection	—Unverified
Towards Explainability and Fairness in Swiss Judgement Prediction: Benchmarking on a Multilingual Dataset	Feb 26, 2024	BenchmarkingCross-Lingual Transfer	—Unverified
Towards Explainable Network Intrusion Detection using Large Language Models	Aug 8, 2024	BenchmarkingIntrusion Detection	—Unverified
Towards Fair Machine Learning Software: Understanding and Addressing Model Bias Through Counterfactual Thinking	Feb 16, 2023	Benchmarkingcounterfactual	—Unverified
Towards Graph Foundation Models: A Study on the Generalization of Positional and Structural Encodings	Dec 10, 2024	BenchmarkingGraph Learning	—Unverified
Towards Ideal Temporal Graph Neural Networks: Evaluations and Conclusions after 10,000 GPU Hours	Dec 28, 2024	BenchmarkingGPU	—Unverified
Towards Large Language Models that Benefit for All: Benchmarking Group Fairness in Reward Models	Mar 10, 2025	AllBenchmarking	—Unverified
Towards Large-Scale Small Object Detection: Survey and Benchmarks	Jul 28, 2022	BenchmarkingObject	—Unverified
Towards Long-Term predictions of Turbulence using Neural Operators	Jul 25, 2023	Benchmarking	—Unverified
Towards More Robust NLP System Evaluation: Handling Missing Scores in Benchmarks	May 17, 2023	Benchmarking	—Unverified
Towards Personalized Federated Learning	Mar 1, 2021	BenchmarkingFederated Learning	—Unverified
Towards Private Learning on Decentralized Graphs with Local Differential Privacy	Jan 23, 2022	BenchmarkingGraph Learning	—Unverified
Towards Productionizing Subjective Search Systems	Mar 31, 2020	BenchmarkingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 168 of 222Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	GPT-4 Turbo	ACC	0.56	—	Unverified