The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 951–975 of 177339 papers

Title	Date	Tasks	Status	Hype	Score
MobileVLM V2: Faster and Stronger Baseline for Vision Language Model	Feb 6, 2024	AutoMLLanguage Modeling	CodeCode Available	5	5
MV-Adapter: Multi-view Consistent Image Generation Made Easy	Dec 4, 2024	3D GenerationImage Generation	CodeCode Available	5	5
DataDreamer: A Tool for Synthetic Data Generation and Reproducible LLM Workflows	Feb 16, 2024	Synthetic Data Generation	CodeCode Available	5	5
DeepPhase: Periodic Autoencoders for Learning Motion Phase Manifolds	Jul 22, 2022	Motion Synthesis	CodeCode Available	5	5
WavTokenizer: an Efficient Acoustic Discrete Codec Tokenizer for Audio Language Modeling	Aug 29, 2024	Language ModelingLanguage Modelling	CodeCode Available	5	5
Stream-Omni: Simultaneous Multimodal Interactions with Large Language-Vision-Speech Model	Jun 16, 2025	Large Language Modelmultimodal interaction	CodeCode Available	5	5
Understanding R1-Zero-Like Training: A Critical Perspective	Mar 26, 2025	Reinforcement Learning (RL)	CodeCode Available	5	5
OmniDocBench: Benchmarking Diverse PDF Document Parsing with Comprehensive Annotations	Dec 10, 2024	AttributeBenchmarking	CodeCode Available	5	5
NovelSeek: When Agent Becomes the Scientist -- Building Closed-Loop System from Hypothesis to Verification	May 22, 2025	2D Semantic SegmentationActivity Prediction	CodeCode Available	5	5
CogAgent: A Visual Language Model for GUI Agents	Dec 14, 2023	Language Modeling	CodeCode Available	5	5
Transformer-Squared: Self-adaptive LLMs	Jan 9, 2025		CodeCode Available	5	5
CogVLM: Visual Expert for Pretrained Language Models	Nov 6, 2023	1 Image, 2*2 StitchingFS-MEVQA	CodeCode Available	5	5
Aria: An Open Multimodal Native Mixture-of-Experts Model	Oct 8, 2024	Instruction FollowingMixture-of-Experts	CodeCode Available	5	5
Advancing Humanoid Locomotion: Mastering Challenging Terrains with Denoising World Model Learning	Aug 26, 2024	Denoisingreinforcement-learning	CodeCode Available	5	5
τ-bench: A Benchmark for Tool-Agent-User Interaction in Real-World Domains	Jun 17, 2024		CodeCode Available	5	5
A Brief Overview of AI Governance for Responsible Machine Learning Systems	Nov 21, 2022		CodeCode Available	5	5
Autoregressive Image Generation without Vector Quantization	Jun 17, 2024	Image GenerationQuantization	CodeCode Available	5	5
Representing Long Volumetric Video with Temporal Gaussian Hierarchy	Dec 12, 2024	GPU	CodeCode Available	5	5
Scalable Diffusion Models with Transformers	Dec 19, 2022	Image Generation	CodeCode Available	5	5
Awesome Multi-modal Object Tracking	May 23, 2024	Autonomous DrivingKnowledge Distillation	CodeCode Available	5	5
Trajectory Prediction Meets Large Language Models: A Survey	Jun 3, 2025	Language ModelingLanguage Modelling	CodeCode Available	5	5
PaperBench: Evaluating AI's Ability to Replicate AI Research	Apr 2, 2025		CodeCode Available	5	5
4th PVUW MeViS 3rd Place Report: Sa2VA	Apr 1, 2025	Language ModelingLanguage Modelling	CodeCode Available	5	5
GAM(e) changer or not? An evaluation of interpretable machine learning models based on additive model constraints	Apr 19, 2022	Additive modelsExplainable artificial intelligence	CodeCode Available	5	5
Exploring Large Language Model based Intelligent Agents: Definitions, Methods, and Prospects	Jan 7, 2024	Language ModelingLanguage Modelling	CodeCode Available	5	5