The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8151–8175 of 177340 papers

Title	Date	Tasks	Status	Hype	Score
DexGarmentLab: Dexterous Garment Manipulation Environment with Generalizable Policy	May 16, 2025	Reinforcement Learning (RL)	CodeCode Available	2	5
RBF++: Quantifying and Optimizing Reasoning Boundaries across Measurable and Unmeasurable Capabilities for Chain-of-Thought Reasoning	May 19, 2025		CodeCode Available	2	5
CPRet: A Dataset, Benchmark, and Model for Retrieval in Competitive Programming	May 19, 2025	FairnessLarge Language Model	CodeCode Available	2	5
Recollection from Pensieve: Novel View Synthesis via Learning from Uncalibrated Videos	May 19, 2025	3D geometryCamera Pose Estimation	CodeCode Available	2	5
Neurosymbolic Diffusion Models	May 19, 2025	Autonomous DrivingUncertainty Quantification	CodeCode Available	2	5
Temporal Query Network for Efficient Multivariate Time Series Forecasting	May 19, 2025	Correlated Time Series ForecastingMultivariate Time Series Forecasting	CodeCode Available	2	5
Efficient Speech Language Modeling via Energy Distance in Continuous Latent Space	May 19, 2025	Language ModelingLanguage Modelling	CodeCode Available	2	5
UniCTokens: Boosting Personalized Understanding and Generation via Unified Concept Tokens	May 20, 2025		CodeCode Available	2	5
KORGym: A Dynamic Game Platform for LLM Reasoning Evaluation	May 20, 2025	reinforcement-learningReinforcement Learning	CodeCode Available	2	5
MARS: Mixture of Auto-Regressive Models for Fine-grained Text-to-image Synthesis	Jul 10, 2024	GPUImage Generation	CodeCode Available	2	5
QuickVideo: Real-Time Long Video Understanding with System Algorithm Co-Design	May 22, 2025	CPUGPU	CodeCode Available	2	5
Think or Not? Selective Reasoning via Reinforcement Learning for Vision-Language Models	May 22, 2025	Reinforcement Learning (RL)	CodeCode Available	2	5
LiteCUA: Computer as MCP Server for Computer-Use Agent on AIOS	May 24, 2025		CodeCode Available	2	5
Improved Immiscible Diffusion: Accelerate Diffusion Training by Reducing Its Miscibility	May 24, 2025	Denoising	CodeCode Available	2	5
Shifting AI Efficiency From Model-Centric to Data-Centric Compression	May 25, 2025	Position	CodeCode Available	2	5
DoctorAgent-RL: A Multi-Agent Collaborative Reinforcement Learning System for Multi-Turn Clinical Dialogue	May 26, 2025	DiagnosticQuestion Answering	CodeCode Available	2	5
Memory-Efficient Visual Autoregressive Modeling with Scale-Aware KV Cache Compression	May 26, 2025	Zero-shot Generalization	CodeCode Available	2	5
Chain-of-Thought for Autonomous Driving: A Comprehensive Survey and Future Prospects	May 26, 2025	Autonomous DrivingLogical Reasoning	CodeCode Available	2	5
Muddit: Liberating Generation Beyond Text-to-Image with a Unified Discrete Diffusion Model	May 29, 2025	DecoderImage Generation	CodeCode Available	2	5
Aligning Modalities in Vision Large Language Models via Preference Fine-tuning	Feb 18, 2024	HallucinationInstruction Following	CodeCode Available	2	5
Vision Language Models are Biased	May 29, 2025	Board Gamescounterfactual	CodeCode Available	2	5
Unifying Appearance Codes and Bilateral Grids for Driving Scene Gaussian Splatting	Jun 5, 2025	Autonomous DrivingNeRF	CodeCode Available	2	5
CyberGym: Evaluating AI Agents' Cybersecurity Capabilities with Real-World Vulnerabilities at Scale	Jun 3, 2025	Large Language Model	CodeCode Available	2	5
GSCodec Studio: A Modular Framework for Gaussian Splat Compression	Jun 2, 2025	Benchmarking	CodeCode Available	2	5
MagiCodec: Simple Masked Gaussian-Injected Codec for High-Fidelity Reconstruction and Generation	May 31, 2025	Language ModelingLanguage Modelling	CodeCode Available	2	5