The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9701–9725 of 474278 papers

Title	Date	Status
InqEduAgent: Adaptive AI Learning Partners with Gaussian Process Augmentation	Sep 26, 2025	CodeCode Available
ArabJobs: A Multinational Corpus of Arabic Job Ads	Sep 26, 2025	CodeCode Available
Shape-for-Motion: Precise and Consistent Video Editing with 3D Proxy	Sep 26, 2025	—Unverified
KV Cache Steering for Controlling Frozen LLMs	Sep 26, 2025	—Unverified
UltraHorizon: Benchmarking Agent Capabilities in Ultra Long-Horizon Scenarios	Sep 26, 2025	CodeCode Available
SemanticControl: A Training-Free Approach for Handling Loosely Aligned Visual Conditions in ControlNet	Sep 26, 2025	—Unverified
Mind-the-Glitch: Visual Correspondence for Detecting Inconsistencies in Subject-Driven Generation	Sep 26, 2025	—Unverified
MesaTask: Towards Task-Driven Tabletop Scene Generation via 3D Spatial Reasoning	Sep 26, 2025	—Unverified
StateX: Enhancing RNN Recall via Post-training State Expansion	Sep 26, 2025	—Unverified
SPARK: Synergistic Policy And Reward Co-Evolving Framework	Sep 26, 2025	—Unverified
WebGen-Agent: Enhancing Interactive Website Generation with Multi-Level Feedback and Step-Level Reinforcement Learning	Sep 26, 2025	—Unverified
VoiceAssistant-Eval: Benchmarking AI Assistants across Listening, Speaking, and Viewing	Sep 26, 2025	—Unverified
SpotEdit: Evaluating Visually-Guided Image Editing Methods	Sep 26, 2025	CodeCode Available
A benchmark for vericoding: formally verified program synthesis	Sep 26, 2025	CodeCode Available
Infusing Theory of Mind into Socially Intelligent LLM Agents	Sep 26, 2025	—Unverified
VideoScore2: Think before You Score in Generative Video Evaluation	Sep 26, 2025	—Unverified
CapRL: Stimulating Dense Image Caption Capabilities via Reinforcement Learning	Sep 26, 2025	CodeCode Available
WebExplorer: Explore and Evolve for Training Long-Horizon Web Agents	Sep 26, 2025	—Unverified
StableToken: A Noise-Robust Semantic Speech Tokenizer for Resilient SpeechLLMs	Sep 26, 2025	—Unverified
CHRONOBERG: Capturing Language Evolution and Temporal Awareness in Foundation Models	Sep 26, 2025	CodeCode Available
Debiased Front-Door Learners for Heterogeneous Effects	Sep 26, 2025	CodeCode Available
HiPerformer: A High-Performance Global-Local Segmentation Model with Modular Hierarchical Fusion Strategy	Sep 26, 2025	CodeCode Available
LFA-Net: A Lightweight Network with LiteFusion Attention for Retinal Vessel Segmentation	Sep 26, 2025	CodeCode Available
LongScape: Advancing Long-Horizon Embodied World Models with Context-Aware MoE	Sep 26, 2025	CodeCode Available
Graph of Agents: Principled Long Context Modeling by Emergent Multi-Agent Collaboration	Sep 26, 2025	CodeCode Available