The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6251–6300 of 661570 papers

Title	Date	Status	Hype
Fine-tuning is Not Enough: A Parallel Framework for Collaborative Imitation and Reinforcement Learning in End-to-end Autonomous Driving	Mar 14, 2026	—Unverified	0
CIPHER: Culvert Inspection through Pairwise Frame Selection and High-Efficiency Reconstruction	Mar 14, 2026	—Unverified	0
Unified Text-Image-to-Video Generation: A Training-Free Approach to Flexible Visual Conditioning	Mar 14, 2026	—Unverified	0
Preconditioned Test-Time Adaptation for Out-of-Distribution Debiasing in Narrative Generation	Mar 14, 2026	—Unverified	0
OraPO: Oracle-educated Reinforcement Learning for Data-efficient and Factual Radiology Report Generation	Mar 14, 2026	—Unverified	0
The Phenomenology of Hallucinations	Mar 14, 2026	—Unverified	0
Sampling as Bandits: Evaluation-Efficient Design for Black-Box Densities	Mar 14, 2026	—Unverified	0
Masked Representation Modeling for Domain-Adaptive Segmentation	Mar 14, 2026	—Unverified	0
Revisiting Vision Language Foundations for No-Reference Image Quality Assessment	Mar 14, 2026	—Unverified	0
UniPrototype: Humn-Robot Skill Learning with Uniform Prototypes	Mar 14, 2026	—Unverified	0
Multi-View Camera System for Variant-Aware Autonomous Vehicle Inspection and Defect Detection	Mar 14, 2026	—Unverified	0
Understanding Sensitivity of Differential Attention through the Lens of Adversarial Robustness	Mar 14, 2026	—Unverified	0
TsLLM: Augmenting LLMs for General Time Series Understanding and Prediction	Mar 14, 2026	—Unverified	0
Eliciting Chain-of-Thought Reasoning for Time Series Analysis using Reinforcement Learning	Mar 14, 2026	—Unverified	0
Purrception: Variational Flow Matching for Vector-Quantized Image Generation	Mar 14, 2026	—Unverified	0
Transfer Learning with Distance Covariance for Random Forest: Error Bounds and an EHR Application	Mar 14, 2026	—Unverified	0
PRISM: Enhancing Protein Inverse Folding through Fine-Grained Retrieval on Structure-Sequence Multimodal Representations	Mar 14, 2026	—Unverified	0
Justitia: Fair and Efficient Scheduling of Task-parallel LLM Agents with Selective Pampering	Mar 14, 2026	—Unverified	0
VISTA: Verification In Sequential Turn-based Assessment	Mar 14, 2026	—Unverified	0
Privacy-Preserving Explainable AIoT Application via SHAP Entropy Regularization	Mar 14, 2026	—Unverified	0
IDALC: A Semi-Supervised Framework for Intent Detection and Active Learning based Correction	Mar 14, 2026	—Unverified	0
Decoupled Action Expert: Confining Task Knowledge to the Conditioning Pathway	Mar 14, 2026	—Unverified	0
UniFlow: Zero-Shot LiDAR Scene Flow for Autonomous Vehicles	Mar 14, 2026	—Unverified	0
Uncertainty Quantification and Data Efficiency in AI: An Information-Theoretic Perspective	Mar 14, 2026	—Unverified	0
ShaRP: SHAllow-LayeR Pruning for Efficient Video Large Language Models	Mar 14, 2026	—Unverified	0
Composing Concepts from Images and Videos via Concept-prompt Binding	Mar 14, 2026	—Unverified	2
SigMA: Path Signatures and Multi-head Attention for Learning Parameters in fBm-driven SDEs	Mar 14, 2026	—Unverified	0
ARMFlow: AutoRegressive MeanFlow for Online 3D Human Reaction Generation	Mar 14, 2026	—Unverified	0
GMODiff: One-Step Gain Map Refinement with Diffusion Priors for HDR Reconstruction	Mar 14, 2026	—Unverified	0
On the Existence and Behavior of Secondary Attention Sinks	Mar 14, 2026	CodeCode Available	0
Diversity or Precision? A Deep Dive into Next Token Prediction	Mar 14, 2026	—Unverified	0
V-CORE: Temporally Consistent Video Understanding for Video-LLM	Mar 14, 2026	—Unverified	0
VIBEVOICE-ASR Technical Report	Mar 14, 2026	—Unverified	0
DECEIVE-AFC: Adversarial Claim Attacks against Search-Enabled LLM-based Fact-Checking Systems	Mar 14, 2026	—Unverified	0
Seg-MoE: Multi-Resolution Segment-wise Mixture-of-Experts for Time Series Forecasting Transformers	Mar 14, 2026	—Unverified	0
Low-Dimensional and Transversely Curved Optimization Dynamics in Grokking	Mar 14, 2026	—Unverified	0
Early-Warning Signals of Grokking via Loss-Landscape Geometry	Mar 14, 2026	—Unverified	0
Evaluating Four FPGA-accelerated Space Use Cases based on Neural Network Algorithms for On-board Inference	Mar 14, 2026	—Unverified	0
When LoRA Betrays: Backdooring Text-to-Image Models by Masquerading as Benign Adapters	Mar 14, 2026	—Unverified	0
Induction Meets Biology: Mechanisms of Repeat Detection in Protein Language Models	Mar 14, 2026	—Unverified	0
A Gauge Theory of Superposition: Toward a Sheaf-Theoretic Atlas of Neural Representations	Mar 14, 2026	—Unverified	0
Do Mixed-Vendor Multi-Agent LLMs Improve Clinical Diagnosis?	Mar 14, 2026	—Unverified	0
Aura: Universal Multi-dimensional Exogenous Integration for Aviation Time Series	Mar 14, 2026	—Unverified	0
AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision	Mar 14, 2026	—Unverified	0
AutoControl Arena: Synthesizing Executable Test Environments for Frontier AI Risk Evaluation	Mar 14, 2026	—Unverified	0
DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models	Mar 14, 2026	—Unverified	0
Learning Adaptive LLM Decoding	Mar 14, 2026	—Unverified	0
Robust Regularized Policy Iteration under Transition Uncertainty	Mar 14, 2026	—Unverified	0
PDE-SSM: A Spectral State Space Approach to Spatial Mixing in Diffusion Transformers	Mar 14, 2026	—Unverified	0
SVD Contextual Sparsity Predictors for Fast LLM Inference	Mar 14, 2026	—Unverified	0