The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

510,095 papers251,776 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 510095 papers

Title	Date	Status
Multi-Resolution Flow Matching: Training-Free Diffusion Acceleration via Staged Sampling	Jul 2, 2026	—Unverified
DeadPool: Resilient LLM Training with Hot-Swapping via Zero-Overhead Checkpoint	Jul 2, 2026	—Unverified
AgenticDataBench: A Comprehensive Benchmark for Data Agents	Jul 2, 2026	—Unverified
Boosting Ultrasound Image Classification via Attribute-Guided Dual-Branch Framework	Jul 2, 2026	—Unverified
Plug-and-Play Volumetric Reconstruction for Compressive Sensing Light-Sheet Microscopy	Jul 2, 2026	—Unverified
CALM: Interpretable Cross-Modal Alignment for Biomarker Discovery from Unpaired Data	Jul 2, 2026	—Unverified
Domain Generalization via Text-Anchored Information Bottleneck	Jul 2, 2026	—Unverified
Teaching Vision-Language-Action Models What to See and Where to Look	Jul 2, 2026	—Unverified
Diverse Evidence, Better Forecasts: Multi-Agent Deliberation Under Information Asymmetry	Jul 2, 2026	—Unverified
Unified Panoramic-Gaussian Representation for Monocular 4D Scene Synthesis	Jul 2, 2026	—Unverified
Revisiting Decentralized Online Convex Optimization with Compressed Communication	Jul 2, 2026	—Unverified
Temporal and Cross-Modal Alignment for Enhanced Audiovisual Video Captioning	Jul 2, 2026	—Unverified
Descriptor: LYNRED Mobility Dataset Multimodal Detection Subset (LYNRED-MDS)	Jul 2, 2026	—Unverified
UniWind: Toward Unified Day-Ahead Wind Power Forecasting via Physics-Informed State Routing	Jul 2, 2026	—Unverified
Separating Expert Retention from Autonomous Source Inference in Raw-ECG-Replay-Free Continual ECG Deployment	Jul 2, 2026	—Unverified
HistoSeg++: Delving deeper with attention and multiscale feature fusion for biomarker segmentation	Jul 2, 2026	—Unverified
ICDepth: Taming Video Diffusion Models for Video Depth Estimation via In-Context Conditioning	Jul 2, 2026	—Unverified
Beyond Gradient-Based Attacks: Adversarial Robustness and Explainability Stability in Cybersecurity Classifiers	Jul 2, 2026	—Unverified
WARP: Weight-Space Analysis for Recovering Training Data Portfolios	Jul 2, 2026	—Unverified
Model Merging as Probabilistic Inference in Fine-Tuning Parameter Space	Jul 2, 2026	—Unverified
Epistemic Goggles: A Pretrained Module that Induces an Epistemic Frame via Gradient Editing	Jul 2, 2026	—Unverified
A Mathematical Introduction to Diffusion Models	Jul 2, 2026	—Unverified
Pmeta-TLA: Backdoor Attacks for Speech Classification Models via Meta-Learning with Timbre Leakage Attack	Jul 2, 2026	—Unverified
LASER: A Corrective Lens for LVLMs via Visual Attention Preservation and Sink Suppression	Jul 2, 2026	—Unverified
Consistent Scene Understanding in 3D Gaussian Splatting via Multi-Cue Mask Refinement	Jul 2, 2026	—Unverified
COMFYCLAW: Self-Evolving Skill Harnesses for Image Generation Workflows	Jul 2, 2026	—Unverified
Generic Expert Coverage for Pruning SparseMixture-of-Experts Language Models	Jul 2, 2026	—Unverified
Distributionally Robust Listwise Preference Optimization	Jul 2, 2026	—Unverified
When Does Generating More Help? Disentangling Fixed-Source Synthesis from Source Expansion in Synthetic Data Scaling	Jul 2, 2026	—Unverified
Beyond Pixel Diffs: Benchmarking Image Change Captioning for Web UI Visual Regression Testing	Jul 2, 2026	—Unverified
DRL-CLBA: A Clean Label Backdoor Attack for Speech Classification via DDPG Reinforcement Learning	Jul 2, 2026	—Unverified
Rethinking Speech-LLM Integration for ASR: Effective Joint Speech-Text Training by Interleaving	Jul 2, 2026	—Unverified
Reformalization of the Jordan Curve Theorem	Jul 2, 2026	—Unverified
Predicting Closed-Loop Performance of Latent World Models: Offline Checkpoint Selection for MPC and Model-Based RL Under Non-Markovian Rewards in LunarLander	Jul 2, 2026	—Unverified
ReQuest: Rethinking-based Question-Aware Frame Selection for Long-Form Video QA	Jul 2, 2026	—Unverified
Meta-Benchmarks for Financial-Services LLM Evaluation	Jul 2, 2026	—Unverified
Full Bayesian Reinforcement Learning via LF-IBIS	Jul 2, 2026	—Unverified
InterCMDM: Block-Causal Diffusion for Autoregressive Human Interaction Generation	Jul 2, 2026	—Unverified
Finite-Lag Operator Geometry of Recurrent Representations	Jul 2, 2026	—Unverified
RTE-FM-Dehazer: Radiative Transfer Equation Inspired Flow Matching for Real-World Image Dehazing	Jul 2, 2026	—Unverified
MedStreamBench: A Time-Aware Benchmark for Streaming and Proactive Medical Video Understanding	Jul 2, 2026	—Unverified
Efficient Temporal Point Processes via Monotone Alternating Splines	Jul 2, 2026	—Unverified
The Turning Point of 3D Plant Phenotyping: 3D Foundation Models Enable Minute-to-Second Cross-Crop Reconstruction and Beyond	Jul 2, 2026	—Unverified
Path-level Hindsight Instructions for Semantic Exploration in Vision-Language Navigation	Jul 2, 2026	—Unverified
Decentralized Stochastic Subgradient-type Methods with Communication Compression for Nonsmooth Nonconvex Optimization	Jul 2, 2026	—Unverified
ProSAC-CT: Progressive Spectral-Anatomical Co-Guided Multi-Stage Diffusion Model for Low-Dose CT Denoising	Jul 2, 2026	—Unverified
DL-VINS-Factory: A Modular Framework for Learned Visual Front-Ends in Visual-Inertial SLAM	Jul 2, 2026	—Unverified
ProCal: Inference-Time Proposal Calibration for Open-Vocabulary Object Detection	Jul 2, 2026	—Unverified
Role-Aware Neural Convex Divergence Heads for Asymmetric Representation Learning	Jul 2, 2026	—Unverified
Denser Better: Limits of On-Policy Self-Distillation for Continual Post-Training	Jul 2, 2026	—Unverified