The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4151–4175 of 661570 papers

Title	Date	Status	Hype
Rolling Sink: Bridging Limited-Horizon Training and Open-Ended Testing in Autoregressive Video Diffusion	Mar 18, 2026	—Unverified	2
Detecting Transportation Mode Using Dense Smartphone GPS Trajectories and Transformer Models	Mar 18, 2026	—Unverified	0
SWE-CI: Evaluating Agent Capabilities in Maintaining Codebases via Continuous Integration	Mar 18, 2026	—Unverified	0
A Hierarchical Error-Corrective Graph Framework for Autonomous Agents with LLM-Based Action Generation	Mar 18, 2026	—Unverified	0
Context-Nav: Context-Driven Exploration and Viewpoint-Aware 3D Spatial Reasoning for Instance Navigation	Mar 18, 2026	—Unverified	0
Exploiting Adaptive Channel Pruning for Communication-Efficient Split Learning	Mar 18, 2026	—Unverified	0
Coherent Human-Scene Reconstruction from Multi-Person Multi-View Video in a Single Pass	Mar 18, 2026	—Unverified	0
Human-AI Co-reasoning for Clinical Diagnosis with Evidence-Integrated Language Agent	Mar 18, 2026	—Unverified	0
Just-in-Time: Training-Free Spatial Acceleration for Diffusion Transformers	Mar 18, 2026	—Unverified	0
Multimodal Emotion Recognition via Bi-directional Cross-Attention and Temporal Modeling	Mar 18, 2026	—Unverified	0
Real-World AI Evaluation: How FRAME Generates Systematic Evidence to Resolve the Decision-Maker's Dilemma	Mar 18, 2026	—Unverified	0
Spatial Transcriptomics as Images for Large-Scale Pretraining	Mar 18, 2026	—Unverified	0
SAATT Nav: a Socially Aware Autonomous Transparent Transportation Navigation Framework for Wheelchairs	Mar 18, 2026	—Unverified	0
The Reasoning Bottleneck in Graph-RAG: Structured Prompting and Context Compression for Multi-Hop QA	Mar 18, 2026	—Unverified	0
AvatarForcing: One-Step Streaming Talking Avatars via Local-Future Sliding-Window Denoising	Mar 18, 2026	—Unverified	0
SemanticFace: Semantic Facial Action Estimation via Semantic Distillation in Interpretable Space	Mar 18, 2026	—Unverified	0
F2HDR: Two-Stage HDR Video Reconstruction via Flow Adapter and Physical Motion Modeling	Mar 18, 2026	—Unverified	0
Training-free Detection of Generated Videos via Spatial-Temporal Likelihoods	Mar 18, 2026	—Unverified	0
Open Biomedical Knowledge Graphs at Scale: Construction, Federation, and AI Agent Access with Samyama Graph Database	Mar 18, 2026	—Unverified	0
A Tutorial on ALOS2 SAR Utilization: Dataset Preparation, Self-Supervised Pretraining, and Semantic Segmentation	Mar 18, 2026	—Unverified	0
I Know What I Don't Know: Latent Posterior Factor Models for Multi-Evidence Probabilistic Reasoning	Mar 18, 2026	—Unverified	0
Theoretical Foundations of Latent Posterior Factors: Formal Guarantees for Multi-Evidence Reasoning	Mar 18, 2026	—Unverified	0
A Framework and Prototype for a Navigable Map of Datasets in Engineering Design and Systems Engineering	Mar 18, 2026	—Unverified	0
OMNIFLOW: A Physics-Grounded Multimodal Agent for Generalized Scientific Reasoning	Mar 18, 2026	—Unverified	0
100x Cost & Latency Reduction: Performance Analysis of AI Query Approximation using Lightweight Proxy Models	Mar 18, 2026	—Unverified	0