The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2451–2500 of 659983 papers

Title	Date	Status
Stable Deep Reinforcement Learning via Isotropic Gaussian Representations	Mar 18, 2026	—Unverified
EchoGen: Cycle-Consistent Learning for Unified Layout-Image Generation and Understanding	Mar 18, 2026	—Unverified
Loc3R-VLM: Language-based Localization and 3D Reasoning with Vision-Language Models	Mar 18, 2026	—Unverified
Universal Sparse Autoencoders: Interpretable Cross-Model Concept Alignment	Mar 18, 2026	—Unverified
Surrogate Model for Heat Transfer Prediction in Impinging Jet Arrays using Dynamic Inlet/Outlet and Flow Rate Control	Mar 18, 2026	—Unverified
Entity-Specific Cyber Risk Assessment using InsurTech Empowered Risk Factors	Mar 18, 2026	—Unverified
MMSearch-Plus: Benchmarking Provenance-Aware Search for Multimodal Browsing Agents	Mar 18, 2026	—Unverified
Enhancing Reinforcement Learning Fine-Tuning with an Online Refiner	Mar 18, 2026	—Unverified
Universal Inverse Distillation for Matching Models with Real-Data Supervision (No GANs)	Mar 18, 2026	CodeCode Available
Simulation to Rules: A Dual-VLM Framework for Formal Visual Planning	Mar 18, 2026	—Unverified
An Improved Model-Free Decision-Estimation Coefficient with Applications in Adversarial MDPs	Mar 18, 2026	—Unverified
Bridging Earth and Space: A Survey on HAPS for Non-Terrestrial Networks	Mar 18, 2026	—Unverified
Seeing Beyond the Image: ECG and Anatomical Knowledge-Guided Myocardial Scar Segmentation from Late Gadolinium-Enhanced Images	Mar 18, 2026	—Unverified
DuoTeach: Dual Role Self-Teaching for Coarse-to-Fine Decision Coordination in Vision--Language Models	Mar 18, 2026	—Unverified
Embedding Physical Reasoning into Diffusion-Based Shadow Generation	Mar 18, 2026	—Unverified
GriDiT: Factorized Grid-Based Diffusion for Efficient Long Image Sequence Generation	Mar 18, 2026	—Unverified
SF-RAG: Structure-Fidelity Retrieval-Augmented Generation for Academic Question Answering	Mar 18, 2026	—Unverified
Causality is Key for Interpretability Claims to Generalise	Mar 18, 2026	—Unverified
Thousand-GPU Large-Scale Training and Optimization Recipe for AI-Native Cloud Embodied Intelligence Infrastructure	Mar 18, 2026	—Unverified
Systematic Scaling Analysis of Jailbreak Attacks in Large Language Models	Mar 18, 2026	—Unverified
MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems	Mar 18, 2026	CodeCode Available
SoulX-LiveAct: Towards Hour-Scale Real-Time Human Animation with Neighbor Forcing and ConvKV Memory	Mar 18, 2026	—Unverified
A Stability-Aware Frozen Euler Autoencoder for Physics-Informed Tracking in Continuum Mechanics (SAFE-PIT-CM)	Mar 18, 2026	—Unverified
Spectral Edge Dynamics of Training Trajectories: Signal--Noise Geometry Across Scales	Mar 18, 2026	—Unverified
AsgardBench -- Evaluating Visually Grounded Interactive Planning Under Minimal Feedback	Mar 18, 2026	—Unverified
Generative Replica-Exchange: A Flow-based Framework for Accelerating Replica Exchange Simulations	Mar 18, 2026	—Unverified
Q-Drift: Quantization-Aware Drift Correction for Diffusion Model Sampling	Mar 18, 2026	—Unverified
STEP: Detecting Audio Backdoor Attacks via Stability-based Trigger Exposure Profiling	Mar 18, 2026	—Unverified
Adaptive Domain Models: Bayesian Evolution, Warm Rotation, and Principled Training for Geometric and Neuromorphic AI	Mar 18, 2026	—Unverified
Understanding Task Aggregation for Generalizable Ultrasound Foundation Models	Mar 18, 2026	—Unverified
Learning-Augmented Algorithms for k-median via Online Learning	Mar 18, 2026	—Unverified
ResNets of All Shapes and Sizes: Convergence of Training Dynamics in the Large-scale Limit	Mar 18, 2026	—Unverified
VLM-AutoDrive: Post-Training Vision-Language Models for Safety-Critical Autonomous Driving Events	Mar 18, 2026	—Unverified
Retrieval-Augmented LLMs for Security Incident Analysis	Mar 18, 2026	—Unverified
Retrieval-Augmented LLM Agents: Learning to Learn from Experience	Mar 18, 2026	—Unverified
A Computationally Efficient Learning of Artificial Intelligence System Reliability Considering Error Propagation	Mar 18, 2026	—Unverified
MolRGen: A Training and Evaluation Setting for De Novo Molecular Generation with Reasonning Models	Mar 18, 2026	—Unverified
CORE: Robust Out-of-Distribution Detection via Confidence and Orthogonal Residual Scoring	Mar 18, 2026	—Unverified
ALIGN: Adversarial Learning for Generalizable Speech Neuroprosthesis	Mar 18, 2026	—Unverified
Interpretability without actionability: mechanistic methods cannot correct language model errors despite near-perfect internal representations	Mar 18, 2026	—Unverified
Synthetic Data Generation for Training Diversified Commonsense Reasoning Models	Mar 18, 2026	—Unverified
Search2Motion: Training-Free Object-Level Motion Control via Attention-Consensus Search	Mar 18, 2026	—Unverified
Fundamental Limits of Neural Network Sparsification: Evidence from Catastrophic Interpretability Collapse	Mar 18, 2026	—Unverified
When Validation Fails: Cross-Institutional Blood Pressure Prediction and the Limits of Electronic Health Record-Based Models	Mar 18, 2026	CodeCode Available
MEMO: Memory-Augmented Model Context Optimization for Robust Multi-Turn Multi-Agent LLM Games	Mar 18, 2026	CodeCode Available
Auditing Preferences for Brands and Cultures in LLMs	Mar 18, 2026	—Unverified
Access Controlled Website Interaction for Agentic AI with Delegated Critical Tasks	Mar 18, 2026	—Unverified
CeRA: Breaking the Linear Ceiling of Low-Rank Adaptation via Manifold Expansion	Mar 18, 2026	—Unverified
Continually self-improving AI	Mar 18, 2026	—Unverified
Impact of automatic speech recognition quality on Alzheimer's disease detection from spontaneous speech: a reproducible benchmark study with lexical modeling and statistical validation	Mar 18, 2026	—Unverified