The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5226–5250 of 661570 papers

Title	Date	Tasks	Status	Hype
OpenUni: A Simple Baseline for Unified Multimodal Understanding and Generation	May 29, 2025		CodeCode Available	2
SWE-bench Goes Live!	May 29, 2025		CodeCode Available	2
Hallo4: High-Fidelity Dynamic Portrait Animation via Direct Preference Optimization and Temporal Motion Modulation	May 29, 2025	Portrait AnimationVideo Alignment	CodeCode Available	2
UniTEX: Universal High Fidelity Generative Texturing for 3D Shapes	May 29, 2025	Texture Synthesis	CodeCode Available	2
UniRL: Self-Improving Unified Multimodal Models via Supervised and Reinforcement Learning	May 29, 2025		CodeCode Available	2
ZeroGUI: Automating Online GUI Learning at Zero Human Cost	May 29, 2025		CodeCode Available	2
TextRegion: Text-Aligned Region Tokens from Frozen Image-Text Models	May 29, 2025	Referring ExpressionReferring Expression Comprehension	CodeCode Available	2
DRO: A Python Library for Distributionally Robust Optimization in Machine Learning	May 29, 2025		CodeCode Available	2
VideoREPA: Learning Physics for Video Generation through Relational Alignment with Foundation Models	May 29, 2025	Self-Supervised LearningVideo Generation	CodeCode Available	2
ZIPA: A family of efficient models for multilingual phone recognition	May 29, 2025	Diversity	CodeCode Available	2
ML-Agent: Reinforcing LLM Agents for Autonomous Machine Learning Engineering	May 29, 2025	Large Language ModelPrompt Engineering	CodeCode Available	2
VAU-R1: Advancing Video Anomaly Understanding via Reinforcement Fine-Tuning	May 29, 2025	Anomaly DetectionDescriptive	CodeCode Available	2
ZPressor: Bottleneck-Aware Compression for Scalable Feed-Forward 3DGS	May 29, 2025	3DGSGPU	CodeCode Available	2
Zero-Shot Vision Encoder Grafting via LLM Surrogates	May 28, 2025	DecoderLanguage Modeling	CodeCode Available	2
Unsupervised Post-Training for Multi-Modal LLM Reasoning via GRPO	May 28, 2025	MathReinforcement Learning (RL)	CodeCode Available	2
DistMLIP: A Distributed Inference Platform for Machine Learning Interatomic Potentials	May 28, 2025	Drug Discoverygraph partitioning	CodeCode Available	2
GeoDrive: 3D Geometry-Informed Driving World Model with Precise Action Control	May 28, 2025	3D geometryAutonomous Driving	CodeCode Available	2
cadrille: Multi-modal CAD Reconstruction with Online Reinforcement Learning	May 28, 2025	CAD ReconstructionLarge Language Model	CodeCode Available	2
Reinforcing General Reasoning without Verifiers	May 27, 2025	MathMathematical Reasoning	CodeCode Available	2
LLaMEA-BO: A Large Language Model Evolutionary Algorithm for Automatically Generating Bayesian Optimization Algorithms	May 27, 2025	Bayesian OptimizationBenchmarking	CodeCode Available	2
SPA-RL: Reinforcing LLM Agents via Stepwise Progress Attribution	May 27, 2025	Reinforcement Learning (RL)	CodeCode Available	2
UI-Genie: A Self-Improving Approach for Iteratively Boosting MLLM-based Mobile GUI Agents	May 27, 2025	16k	CodeCode Available	2
HoliTom: Holistic Token Merging for Fast Video Large Language Models	May 27, 2025		CodeCode Available	2
R2R: Efficiently Navigating Divergent Reasoning Paths with Small-Large Model Token Routing	May 27, 2025	Math	CodeCode Available	2
SANSA: Unleashing the Hidden Semantics in SAM2 for Few-Shot Segmentation	May 27, 2025	Object TrackingSegmentation	CodeCode Available	2