The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7376–7400 of 177340 papers

Title	Date	Tasks	Status	Hype	Score
Medical Hallucinations in Foundation Models and Their Impact on Healthcare	Feb 26, 2025	BenchmarkingHallucination	CodeCode Available	2	5
Towards Robust Multi-tab Website Fingerprinting	Jan 22, 2025	Multi-Label ClassificationMUlTI-LABEL-ClASSIFICATION	CodeCode Available	2	5
Self-Training with Direct Preference Optimization Improves Chain-of-Thought Reasoning	Jul 25, 2024	Knowledge DistillationMathematical Reasoning	CodeCode Available	2	5
Tip-Adapter: Training-free Adaption of CLIP for Few-shot Classification	Jul 19, 2022	RetrievalTransfer Learning	CodeCode Available	2	5
Accurate RNA 3D structure prediction using a language model-based deep learning approach	Jul 4, 2022	Language ModelingLanguage Modelling	CodeCode Available	2	5
Guidance with Spherical Gaussian Constraint for Conditional Diffusion	Feb 5, 2024	Denoising	CodeCode Available	2	5
TACO: Topics in Algorithmic COde generation dataset	Dec 22, 2023	Code Generation	CodeCode Available	2	5
Data-Driven Parametrization of Molecular Mechanics Force Fields for Expansive Chemical Space Coverage	Aug 23, 2024	Computational EfficiencyDrug Discovery	CodeCode Available	2	5
Steerable Scene Generation with Post Training and Inference-Time Search	May 7, 2025	Scene Generation	CodeCode Available	2	5
VFIMamba: Video Frame Interpolation with State Space Models	Jul 2, 2024	2k4k	CodeCode Available	2	5
CodeSteer: Symbolic-Augmented Language Models via Code/Text Guidance	Feb 4, 2025	Code GenerationText Generation	CodeCode Available	2	5
PyGRF: An improved Python Geographical Random Forest model and case studies in public health and natural disasters	Sep 20, 2024		CodeCode Available	2	5
geomstats: a Python Package for Riemannian Geometry in Machine Learning	May 21, 2018	BIG-bench Machine LearningGPU	CodeCode Available	2	5
XCube: Large-Scale 3D Generative Modeling using Sparse Voxel Hierarchies	Dec 6, 2023	3D Shape GenerationScene Generation	CodeCode Available	2	5
PAM: Prompting Audio-Language Models for Audio Quality Assessment	Feb 1, 2024	Audio Quality AssessmentMusic Generation	CodeCode Available	2	5
Geometry-Complete Diffusion for 3D Molecule Generation and Optimization	Feb 8, 2023	3D Molecule GenerationDenoising	CodeCode Available	2	5
GeoLRM: Geometry-Aware Large Reconstruction Model for High-Quality 3D Gaussian Generation	Jun 21, 2024	3D GenerationGPU	CodeCode Available	2	5
Libra: Building Decoupled Vision System on Large Language Models	May 16, 2024	Image to textLanguage Modeling	CodeCode Available	2	5
ALE-Bench: A Benchmark for Long-Horizon Objective-Driven Algorithm Engineering	Jun 10, 2025	Scheduling	CodeCode Available	2	5
EFFOcc: A Minimal Baseline for EFficient Fusion-based 3D Occupancy Network	Jun 11, 2024	3D Object DetectionActive Learning	CodeCode Available	2	5
Towards Open Vocabulary Learning: A Survey	Jun 28, 2023	Open Set LearningOut-of-Distribution Detection	CodeCode Available	2	5
SuperFusion: Multilevel LiDAR-Camera Fusion for Long-Range HD Map Generation	Nov 28, 2022	Autonomous DrivingAutonomous Vehicles	CodeCode Available	2	5
BBTv2: Towards a Gradient-Free Future with Large Language Models	May 23, 2022	Few-Shot LearningLanguage Modelling	CodeCode Available	2	5
SciInstruct: a Self-Reflective Instruction Annotated Dataset for Training Scientific Language Models	Jan 15, 2024	MathMathematical Reasoning	CodeCode Available	2	5
QFFT, Question-Free Fine-Tuning for Adaptive Reasoning	Jun 15, 2025		CodeCode Available	2	5