The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9151–9175 of 474278 papers

Title	Date	Status
Local Reinforcement Learning with Action-Conditioned Root Mean Squared Q-Functions	Oct 8, 2025	CodeCode Available
A Diffusion Model for Regular Time Series Generation from Irregular Data with Completion and Masking	Oct 8, 2025	CodeCode Available
CNN-TFT explained by SHAP with multi-head attention weights for time series forecasting	Oct 8, 2025	CodeCode Available
Lung Infection Severity Prediction Using Transformers with Conditional TransMix Augmentation and Cross-Attention	Oct 8, 2025	CodeCode Available
M3Retrieve: Benchmarking Multimodal Retrieval for Medicine	Oct 8, 2025	CodeCode Available
Unified Molecule Pre-training with Flexible 2D and 3D Modalities: Single and Paired Modality Integration	Oct 8, 2025	CodeCode Available
U-Bench: A Comprehensive Understanding of U-Net through 100-Variant Benchmarking	Oct 8, 2025	CodeCode Available
Search-R3: Unifying Reasoning and Embedding Generation in Large Language Models	Oct 8, 2025	CodeCode Available
Accelerating Diffusion LLM Inference via Local Determinism Propagation	Oct 8, 2025	CodeCode Available
GenPilot: A Multi-Agent System for Test-Time Prompt Optimization in Image Generation	Oct 8, 2025	CodeCode Available
How much speech data is necessary for ASR in African languages? An evaluation of data scaling in Kinyarwanda and Kikuyu	Oct 8, 2025	CodeCode Available
SpecGuard: Spectral Projection-based Advanced Invisible Watermarking	Oct 8, 2025	CodeCode Available
SafeProtein: Red-Teaming Framework and Benchmark for Protein Foundation Models	Oct 8, 2025	CodeCode Available
ConstraintLLM: A Neuro-Symbolic Framework for Industrial-Level Constraint Programming	Oct 7, 2025	CodeCode Available
When LLMs Can't Help: Real-World Evaluation of LLMs in Nutrition	Oct 7, 2025	CodeCode Available
Low-Rank Tensor Recovery via Variational Schatten-p Quasi-Norm and Jacobian Regularization	Oct 7, 2025	CodeCode Available
BrowserArena: Evaluating LLM Agents on Real-World Web Navigation Tasks	Oct 7, 2025	—Unverified
Refusal Falls off a Cliff: How Safety Alignment Fails in Reasoning?	Oct 7, 2025	—Unverified
Scientific Algorithm Discovery by Augmenting AlphaEvolve with Deep Research	Oct 7, 2025	CodeCode Available
Moloch's Bargain: Emergent Misalignment When LLMs Compete for Audiences	Oct 7, 2025	—Unverified
Discrete Diffusion Models with MLLMs for Unified Medical Multimodal Generation	Oct 7, 2025	—Unverified
Mixing Mechanisms: How Language Models Retrieve Bound Entities In-Context	Oct 7, 2025	—Unverified
Lumina-DiMOO: An Omni Diffusion Large Language Model for Multi-Modal Generation and Understanding	Oct 7, 2025	—Unverified
Webscale-RL: Automated Data Pipeline for Scaling RL Data to Pretraining Levels	Oct 7, 2025	—Unverified
Multimodal Feature Prototype Learning for Interpretable and Discriminative Cancer Survival Prediction	Oct 7, 2025	CodeCode Available