The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4426–4450 of 661570 papers

Title	Date	Status
Benchmarking Reinforcement Learning via Stochastic Converse Optimality: Generating Systems with Known Optimal Policies	Mar 18, 2026	—Unverified
Process Supervision for Chain-of-Thought Reasoning via Monte Carlo Net Information Gain	Mar 18, 2026	—Unverified
Adaptive Guidance for Retrieval-Augmented Masked Diffusion Models	Mar 18, 2026	—Unverified
From Virtual Environments to Real-World Trials: Emerging Trends in Autonomous Driving	Mar 18, 2026	—Unverified
Federated Distributional Reinforcement Learning with Distributional Critic Regularization	Mar 18, 2026	—Unverified
Machine Learning for Network Attacks Classification and Statistical Evaluation of Machine Learning for Network Attacks Classification and Adversarial Learning Methodologies for Synthetic Data Generation	Mar 18, 2026	—Unverified
SARE: Sample-wise Adaptive Reasoning for Training-free Fine-grained Visual Recognition	Mar 18, 2026	—Unverified
TAPESTRY: From Geometry to Appearance via Consistent Turntable Videos	Mar 18, 2026	—Unverified
Event-Centric Human Value Understanding in News-Domain Texts: An Actor-Conditioned, Multi-Granularity Benchmark	Mar 18, 2026	—Unverified
Omni-3DEdit: Generalized Versatile 3D Editing in One-Pass	Mar 18, 2026	—Unverified
RHYME-XT: A Neural Operator for Spatiotemporal Control Systems	Mar 18, 2026	—Unverified
ShapleyLaw: A Game-Theoretic Approach to Multilingual Scaling Laws	Mar 18, 2026	—Unverified
ConGA: Guidelines for Contextual Gender Annotation. A Framework for Annotating Gender in Machine Translation	Mar 18, 2026	—Unverified
IndicSafe: A Benchmark for Evaluating Multilingual LLM Safety in South Asia	Mar 18, 2026	—Unverified
Only relative ranks matter in weight-clustered large language models	Mar 18, 2026	—Unverified
Multi-Armed Sequential Hypothesis Testing by Betting	Mar 18, 2026	—Unverified
CARE: Covariance-Aware and Rank-Enhanced Decomposition for Enabling Multi-Head Latent Attention	Mar 18, 2026	—Unverified
Beyond Muon: MUD (MomentUm Decorrelation) for Faster Transformer Training	Mar 18, 2026	—Unverified
AHOY! Animatable Humans under Occlusion from YouTube Videos with Gaussian Splatting and Video Diffusion Priors	Mar 18, 2026	—Unverified
Versatile Editing of Video Content, Actions, and Dynamics without Training	Mar 18, 2026	—Unverified
ScheduleMe: Multi-Agent Calendar Assistant	Mar 18, 2026	—Unverified
TRiMS: Real-Time Tracking of Minimal Sufficient Length for Efficient Reasoning via RL	Mar 18, 2026	—Unverified
A Deep Surrogate Model for Robust and Generalizable Long-Term Blast Wave Prediction	Mar 18, 2026	—Unverified
Unlearnable phases of matter	Mar 18, 2026	—Unverified
CTG-DB: An Ontology-Based Transformation of ClinicalTrials.gov to Enable Cross-Trial Drug Safety Analyses	Mar 18, 2026	—Unverified