The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2601–2650 of 659983 papers

Title	Date	Status	Hype
Beware Untrusted Simulators -- Reward-Free Backdoor Attacks in Reinforcement Learning	Mar 18, 2026	—Unverified	0
Rolling Sink: Bridging Limited-Horizon Training and Open-Ended Testing in Autoregressive Video Diffusion	Mar 18, 2026	—Unverified	2
Detecting Transportation Mode Using Dense Smartphone GPS Trajectories and Transformer Models	Mar 18, 2026	—Unverified	0
SWE-CI: Evaluating Agent Capabilities in Maintaining Codebases via Continuous Integration	Mar 18, 2026	—Unverified	0
A Hierarchical Error-Corrective Graph Framework for Autonomous Agents with LLM-Based Action Generation	Mar 18, 2026	—Unverified	0
Context-Nav: Context-Driven Exploration and Viewpoint-Aware 3D Spatial Reasoning for Instance Navigation	Mar 18, 2026	—Unverified	0
Exploiting Adaptive Channel Pruning for Communication-Efficient Split Learning	Mar 18, 2026	—Unverified	0
Coherent Human-Scene Reconstruction from Multi-Person Multi-View Video in a Single Pass	Mar 18, 2026	—Unverified	0
Human-AI Co-reasoning for Clinical Diagnosis with Evidence-Integrated Language Agent	Mar 18, 2026	—Unverified	0
Just-in-Time: Training-Free Spatial Acceleration for Diffusion Transformers	Mar 18, 2026	—Unverified	0
Multimodal Emotion Recognition via Bi-directional Cross-Attention and Temporal Modeling	Mar 18, 2026	—Unverified	0
Real-World AI Evaluation: How FRAME Generates Systematic Evidence to Resolve the Decision-Maker's Dilemma	Mar 18, 2026	—Unverified	0
Spatial Transcriptomics as Images for Large-Scale Pretraining	Mar 18, 2026	—Unverified	0
SAATT Nav: a Socially Aware Autonomous Transparent Transportation Navigation Framework for Wheelchairs	Mar 18, 2026	—Unverified	0
The Reasoning Bottleneck in Graph-RAG: Structured Prompting and Context Compression for Multi-Hop QA	Mar 18, 2026	—Unverified	0
AvatarForcing: One-Step Streaming Talking Avatars via Local-Future Sliding-Window Denoising	Mar 18, 2026	—Unverified	0
SemanticFace: Semantic Facial Action Estimation via Semantic Distillation in Interpretable Space	Mar 18, 2026	—Unverified	0
F2HDR: Two-Stage HDR Video Reconstruction via Flow Adapter and Physical Motion Modeling	Mar 18, 2026	—Unverified	0
Training-free Detection of Generated Videos via Spatial-Temporal Likelihoods	Mar 18, 2026	—Unverified	0
Open Biomedical Knowledge Graphs at Scale: Construction, Federation, and AI Agent Access with Samyama Graph Database	Mar 18, 2026	—Unverified	0
A Tutorial on ALOS2 SAR Utilization: Dataset Preparation, Self-Supervised Pretraining, and Semantic Segmentation	Mar 18, 2026	—Unverified	0
I Know What I Don't Know: Latent Posterior Factor Models for Multi-Evidence Probabilistic Reasoning	Mar 18, 2026	—Unverified	0
Theoretical Foundations of Latent Posterior Factors: Formal Guarantees for Multi-Evidence Reasoning	Mar 18, 2026	—Unverified	0
A Framework and Prototype for a Navigable Map of Datasets in Engineering Design and Systems Engineering	Mar 18, 2026	—Unverified	0
OMNIFLOW: A Physics-Grounded Multimodal Agent for Generalized Scientific Reasoning	Mar 18, 2026	—Unverified	0
100x Cost & Latency Reduction: Performance Analysis of AI Query Approximation using Lightweight Proxy Models	Mar 18, 2026	—Unverified	0
S-VAM: Shortcut Video-Action Model by Self-Distilling Geometric and Semantic Foresight	Mar 18, 2026	—Unverified	0
VIEW2SPACE: Studying Multi-View Visual Reasoning from Sparse Observations	Mar 18, 2026	—Unverified	0
Wasserstein-type Gaussian Process Regressions for Input Measurement Uncertainty	Mar 18, 2026	—Unverified	0
The Causal Uncertainty Principle: Manifold Tearing and the Topological Limits of Counterfactual Interventions	Mar 18, 2026	—Unverified	0
Gesture-Aware Pretraining and Token Fusion for 3D Hand Pose Estimation	Mar 18, 2026	—Unverified	0
Adaptive Anchor Policies for Efficient 4D Gaussian Streaming	Mar 18, 2026	—Unverified	0
From Drop-off to Recovery: A Mechanistic Analysis of Segmentation in MLLMs	Mar 18, 2026	—Unverified	0
Visual SLAM with DEM Anchoring for Lunar Surface Navigation	Mar 18, 2026	—Unverified	0
KANtize: Exploring Low-bit Quantization of Kolmogorov-Arnold Networks for Efficient Inference	Mar 18, 2026	—Unverified	0
Neuron-Level Emotion Control in Speech-Generative Large Audio-Language Models	Mar 18, 2026	—Unverified	0
Deployment and Evaluation of an EHR-integrated, Large Language Model-Powered Tool to Triage Surgical Patients	Mar 18, 2026	—Unverified	0
Neural Radiance Maps for Extraterrestrial Navigation and Path Planning	Mar 18, 2026	—Unverified	0
On the Cone Effect and Modality Gap in Medical Vision-Language Embeddings	Mar 18, 2026	—Unverified	0
Variational Rectification Inference for Learning with Noisy Labels	Mar 18, 2026	—Unverified	0
GigaWorld-Policy: An Efficient Action-Centered World--Action Model	Mar 18, 2026	—Unverified	2
LED: A Benchmark for Evaluating Layout Error Detection in Document Analysis	Mar 18, 2026	—Unverified	0
DANCE: Dynamic 3D CNN Pruning: Joint Frame, Channel, and Feature Adaptation for Energy Efficiency on the Edge	Mar 18, 2026	—Unverified	0
WINFlowNets: Warm-up Integrated Networks Training of Generative Flow Networks for Robotics and Machine Fault Adaptation	Mar 18, 2026	—Unverified	0
From Words to Worlds: Benchmarking Cross-Cultural Cultural Understanding in Machine Translation	Mar 18, 2026	—Unverified	0
Contrastive Reasoning Alignment: Reinforcement Learning from Hidden Representations	Mar 18, 2026	—Unverified	0
Towards Safer Large Reasoning Models by Promoting Safety Decision-Making before Chain-of-Thought Generation	Mar 18, 2026	—Unverified	0
ReLMXEL: Adaptive RL-Based Memory Controller with Explainable Energy and Latency Optimization	Mar 18, 2026	—Unverified	0
InfoDensity: Rewarding Information-Dense Traces for Efficient Reasoning	Mar 18, 2026	—Unverified	0
Deploying Semantic ID-based Generative Retrieval for Large-Scale Podcast Discovery at Spotify	Mar 18, 2026	—Unverified	0