The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9226–9250 of 474278 papers

Title	Date	Status
Let it Calm: Exploratory Annealed Decoding for Verifiable Reinforcement Learning	Oct 6, 2025	—Unverified
Margin Adaptive DPO: Leveraging Reward Model for Granular Control in Preference Optimization	Oct 6, 2025	—Unverified
TimeSeriesScientist: A General-Purpose AI Agent for Time Series Analysis	Oct 6, 2025	—Unverified
TAG:Tangential Amplifying Guidance for Hallucination-Resistant Diffusion Sampling	Oct 6, 2025	—Unverified
Unifying Autoregressive and Diffusion-Based Sequence Generation	Oct 6, 2025	—Unverified
MedPAO: A Protocol-Driven Agent for Structuring Medical Reports	Oct 6, 2025	CodeCode Available
A Spatial-Spectral-Frequency Interactive Network for Multimodal Remote Sensing Classification	Oct 6, 2025	CodeCode Available
Multi-Agent Tool-Integrated Policy Optimization	Oct 6, 2025	—Unverified
MambaMoE: Mixture-of-Spectral-Spatial-Experts State Space Model for Hyperspectral Image Classification	Oct 6, 2025	CodeCode Available
Federated Computation of ROC and PR Curves	Oct 6, 2025	—Unverified
The Telephone Game: Evaluating Semantic Drift in Unified Models	Oct 6, 2025	CodeCode Available
ML2B: Multi-Lingual ML Benchmark For AutoML	Oct 6, 2025	CodeCode Available
Semantic Similarity in Radiology Reports via LLMs and NER	Oct 6, 2025	CodeCode Available
How Different from the Past? Spatio-Temporal Time Series Forecasting with Self-Supervised Deviation Learning	Oct 6, 2025	CodeCode Available
Modeling Student Learning with 3.8 Million Program Traces	Oct 6, 2025	CodeCode Available
First Hallucination Tokens Are Different from Conditional Ones	Oct 6, 2025	CodeCode Available
Fast Witness Persistence for MRI Volumes via Hybrid Landmarking	Oct 6, 2025	CodeCode Available
GRACE: Generative Representation Learning via Contrastive Policy Optimization	Oct 6, 2025	CodeCode Available
FocusMed: A Large Language Model-based Framework for Enhancing Medical Question Summarization with Focus Identification	Oct 6, 2025	CodeCode Available
ID-Consistent, Precise Expression Generation with Blendshape-Guided Diffusion	Oct 6, 2025	CodeCode Available
JSON Whisperer: Efficient JSON Editing with LLMs	Oct 6, 2025	CodeCode Available
LightCache: Memory-Efficient, Training-Free Acceleration for Video Generation	Oct 6, 2025	CodeCode Available
Explaining Human Preferences via Metrics for Structured 3D Reconstruction	Oct 6, 2025	CodeCode Available
RL Is a Hammer and LLMs Are Nails: A Simple Reinforcement Learning Recipe for Strong Prompt Injection	Oct 6, 2025	CodeCode Available
HyperVLA: Efficient Inference in Vision-Language-Action Models via Hypernetworks	Oct 6, 2025	CodeCode Available