The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1301–1325 of 659983 papers

Title	Date	Tasks	Status	Hype
s3: You Don't Need That Much Data to Train a Search Agent via RL	May 20, 2025	RAGReinforcement Learning (RL)	CodeCode Available	4
Scaling Law for Quantization-Aware Training	May 20, 2025	Quantization	CodeCode Available	4
VideoEval-Pro: Robust and Realistic Long Video Understanding Evaluation	May 20, 2025	MMEMultiple-choice	CodeCode Available	4
Multi-head Temporal Latent Attention	May 19, 2025	GPUspeech-recognition	CodeCode Available	4
MM-PRM: Enhancing Multimodal Mathematical Reasoning with Scalable Step-Level Supervision	May 19, 2025	MathMathematical Reasoning	CodeCode Available	4
Mean Flows for One-step Generative Modeling	May 19, 2025		CodeCode Available	4
DreamGen: Unlocking Generalization in Robot Learning through Video World Models	May 19, 2025	Video Generation	CodeCode Available	4
CPGD: Toward Stable Rule-based Reinforcement Learning for Language Models	May 18, 2025	Reinforcement Learning (RL)	CodeCode Available	4
Kornia-rs: A Low-Level 3D Computer Vision Library In Rust	May 18, 2025		CodeCode Available	4
VisionReasoner: Unified Visual Perception and Reasoning via Reinforcement Learning	May 17, 2025	2D Object DetectionObject Counting	CodeCode Available	4
Attention on the Sphere	May 16, 2025	Depth EstimationImage Segmentation	CodeCode Available	4
Accelerating Visual-Policy Learning through Parallel Differentiable Simulation	May 15, 2025	GPU	CodeCode Available	4
OnPrem.LLM: A Privacy-Conscious Document Intelligence Toolkit	May 12, 2025	GPUPrivacy Preserving	CodeCode Available	4
Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free	May 10, 2025	AttributeMixture-of-Experts	CodeCode Available	4
Perception, Reason, Think, and Plan: A Survey on Large Multimodal Reasoning Models	May 8, 2025	Multimodal Reasoning	CodeCode Available	4
FG-CLIP: Fine-Grained Visual and Textual Alignment	May 8, 2025	Image-text Retrievalobject-detection	CodeCode Available	4
3D Scene Generation: A Survey	May 8, 2025	Autonomous DrivingDiversity	CodeCode Available	4
VITA-Audio: Fast Interleaved Cross-Modal Token Generation for Efficient Large Speech-Language Model	May 6, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	4
Unified Multimodal Chain-of-Thought Reward Model through Reinforcement Fine-Tuning	May 6, 2025	Image Generation	CodeCode Available	4
Ming-Lite-Uni: Advancements in Unified Architecture for Natural Multimodal Interaction	May 5, 2025	Image Generationmultimodal interaction	CodeCode Available	4
Towards One-shot Federated Learning: Advances, Challenges, and Future Directions	May 5, 2025	Federated LearningSurvey	CodeCode Available	4
Tevatron 2.0: Unified Document Retrieval Toolkit across Scale, Language, and Modality	May 5, 2025	Retrieval	CodeCode Available	4
T2I-R1: Reinforcing Image Generation with Collaborative Semantic-level and Token-level CoT	May 1, 2025	Image GenerationReinforcement Learning (RL)	CodeCode Available	4
Generalized Neighborhood Attention: Multi-dimensional Sparse Attention at the Speed of Light	Apr 23, 2025		CodeCode Available	4
AIMO-2 Winning Solution: Building State-of-the-Art Mathematical Reasoning Models with OpenMathReasoning dataset	Apr 23, 2025	MathMathematical Reasoning	CodeCode Available	4