The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4776–4800 of 661570 papers

Title	Date	Tasks	Status	Hype
Metadata Embeddings for User and Item Cold-start Recommendations	Jul 30, 2015	TAG	CodeCode Available	3
U-Net: Convolutional Networks for Biomedical Image Segmentation	May 18, 2015	Cell SegmentationCell Tracking	CodeCode Available	3
Supplementary Material for Efficient and Robust Automated Machine Learning	Jan 1, 2015	BIG-bench Machine LearningHyperparameter Optimization	CodeCode Available	3
Efficient Reasoning with Balanced Thinking	Mar 19, 2026		—Unverified	2
GenCompositor: Generative Video Compositing with Diffusion Transformer	Mar 19, 2026		—Unverified	2
FASTER: Rethinking Real-Time Flow VLAs	Mar 19, 2026		—Unverified	2
The Flexibility Trap: Why Arbitrary Order Limits Reasoning Potential in Diffusion Language Models	Mar 19, 2026		—Unverified	2
TerraScope: Pixel-Grounded Visual Reasoning for Earth Observation	Mar 19, 2026		—Unverified	2
TrajBooster: Boosting Humanoid Whole-Body Manipulation via Trajectory-Centric Learning	Mar 19, 2026		—Unverified	2
EffectErase: Joint Video Object Removal and Insertion for High-Quality Effect Erasing	Mar 19, 2026		—Unverified	2
Open-o3-Video: Grounded Video Reasoning with Explicit Spatio-Temporal Evidence	Mar 18, 2026		—Unverified	2
Rolling Sink: Bridging Limited-Horizon Training and Open-Ended Testing in Autoregressive Video Diffusion	Mar 18, 2026		—Unverified	2
GigaWorld-Policy: An Efficient Action-Centered World--Action Model	Mar 18, 2026		—Unverified	2
LoST: Level of Semantics Tokenization for 3D Shapes	Mar 18, 2026		—Unverified	2
SegviGen: Repurposing 3D Generative Model for Part Segmentation	Mar 17, 2026		—Unverified	2
Astrolabe: Steering Forward-Process Reinforcement Learning for Distilled Autoregressive Video Models	Mar 17, 2026		—Unverified	2
SocialOmni: Benchmarking Audio-Visual Social Interactivity in Omni Models	Mar 17, 2026		—Unverified	2
WorldCam: Interactive Autoregressive 3D Gaming Worlds with Camera Pose as a Unifying Geometric Representation	Mar 17, 2026		—Unverified	2
GlyphPrinter: Region-Grouped Direct Preference Optimization for Glyph-Accurate Visual Text Rendering	Mar 16, 2026		—Unverified	2
SKEL-CF: Coarse-to-Fine Biomechanical Skeleton and Surface Mesh Recovery	Mar 16, 2026		—Unverified	2
Autonomous Agents Coordinating Distributed Discovery Through Emergent Artifact Exchange	Mar 15, 2026		—Unverified	2
Composing Concepts from Images and Videos via Concept-prompt Binding	Mar 14, 2026		—Unverified	2
LASER: Layer-wise Scale Alignment for Training-Free Streaming 4D Reconstruction	Mar 14, 2026		—Unverified	2
EnterpriseOps-Gym: Environments and Evaluations for Stateful Agentic Planning and Tool Use in Enterprise Settings	Mar 13, 2026		—Unverified	2
XSkill: Continual Learning from Experience and Skills in Multimodal Agents	Mar 13, 2026		—Unverified	2