The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7001–7050 of 661570 papers

Title	Date	Status
SAW: Toward a Surgical Action World Model via Controllable and Scalable Video Generation	Mar 13, 2026	—Unverified
PISmith: Reinforcement Learning-based Red Teaming for Prompt Injection Defenses	Mar 13, 2026	CodeCode Available
Human-Centered Evaluation of an LLM-Based Process Modeling Copilot: A Mixed-Methods Study with Domain Experts	Mar 13, 2026	—Unverified
IROSA: Interactive Robot Skill Adaptation using Natural Language	Mar 13, 2026	—Unverified
Fourier Angle Alignment for Oriented Object Detection in Remote Sensing	Mar 13, 2026	CodeCode Available
AI Model Modulation with Logits Redistribution	Mar 13, 2026	—Unverified
FastDSAC: Unlocking the Potential of Maximum Entropy RL in High-Dimensional Humanoid Control	Mar 13, 2026	—Unverified
DRIFT-Net: A Spectral--Coupled Neural Operator for PDEs Learning	Mar 13, 2026	CodeCode Available
A2Z-10M+: Geometric Deep Learning with A-to-Z BRep Annotations for AI-Assisted CAD Modeling and Reverse Engineering	Mar 13, 2026	—Unverified
HSEmotion Team at ABAW-10 Competition: Facial Expression Recognition, Valence-Arousal Estimation, Action Unit Detection and Fine-Grained Violence Classification	Mar 13, 2026	—Unverified
CognitionCapturerPro: Towards High-Fidelity Visual Decoding from EEG/MEG via Multi-modal Information and Asymmetric Alignment	Mar 13, 2026	CodeCode Available
DiffProxy: Multi-View Human Mesh Recovery via Diffusion-Generated Dense Proxies	Mar 13, 2026	—Unverified
Beyond Static Instruction: A Multi-agent AI Framework for Adaptive Augmented Reality Robot Training	Mar 13, 2026	—Unverified
Mask2Flow-TSE: Two-Stage Target Speaker Extraction with Masking and Flow Matching	Mar 13, 2026	—Unverified
98 Faster LLM Routing Without a Dedicated GPU: Flash Attention, Prompt Compression, and Near-Streaming for the vLLM Semantic Router	Mar 13, 2026	—Unverified
Dependency-Aware Parallel Decoding via Attention for Diffusion LLMs	Mar 13, 2026	—Unverified
GA-Drive: Geometry-Appearance Decoupled Modeling for Free-viewpoint Driving Scene Generation	Mar 13, 2026	—Unverified
ToolTree: Efficient LLM Agent Tool Planning via Dual-Feedback Monte Carlo Tree Search and Bidirectional Pruning	Mar 13, 2026	—Unverified
The Coherence Trap: When MLLM-Crafted Narratives Exploit Manipulated Visual Contexts	Mar 13, 2026	—Unverified
TubeMLLM: A Foundation Model for Topology Knowledge Exploration in Vessel-like Anatomy	Mar 13, 2026	—Unverified
Thinking in Dynamics: How Multimodal Large Language Models Perceive, Track, and Reason Dynamics in Physical 4D World	Mar 13, 2026	—Unverified
AccelAes: Accelerating Diffusion Transformers for Training-Free Aesthetic-Enhanced Image Generation	Mar 13, 2026	CodeCode Available
SPELL: Self-Play Reinforcement Learning for Evolving Long-Context Language Models	Mar 13, 2026	CodeCode Available
GeoZero: Incentivizing Reasoning from Scratch on Geospatial Scenes	Mar 13, 2026	CodeCode Available
Mitigating Latent Mismatch in cVAE-Based Singing Voice Synthesis via Flow Matching	Mar 13, 2026	CodeCode Available
VLM4Rec: Multimodal Semantic Representation for Recommendation with Large Vision-Language Models	Mar 13, 2026	CodeCode Available
HIFICL: High-Fidelity In-Context Learning for Multimodal Tasks	Mar 13, 2026	CodeCode Available
CM-Bench: A Comprehensive Cross-Modal Feature Matching Benchmark Bridging Visible and Infrared Images	Mar 13, 2026	CodeCode Available
A protocol for evaluating robustness to H&E staining variation in computational pathology models	Mar 13, 2026	CodeCode Available
FedBPrompt: Federated Domain Generalization Person Re-Identification via Body Distribution Aware Visual Prompts	Mar 13, 2026	CodeCode Available
Fair Lung Disease Diagnosis from Chest CT via Gender-Adversarial Attention Multiple Instance Learning	Mar 13, 2026	CodeCode Available
SortScrews: A Dataset and Baseline for Real-time Screw Classification	Mar 13, 2026	CodeCode Available
Think and Answer ME: Benchmarking and Exploring Multi-Entity Reasoning Grounding in Remote Sensing	Mar 13, 2026	CodeCode Available
Vision Verification Enhanced Fusion of VLMs for Efficient Visual Reasoning	Mar 13, 2026	CodeCode Available
HFP-SAM: Hierarchical Frequency Prompted SAM for Efficient Marine Animal Segmentation	Mar 13, 2026	CodeCode Available
UNIStainNet: Foundation-Model-Guided Virtual Staining of H&E to IHC	Mar 13, 2026	CodeCode Available
IGASA: Integrated Geometry-Aware and Skip-Attention Modules for Enhanced Point Cloud Registration	Mar 13, 2026	CodeCode Available
CVGL: Causal Learning and Geometric Topology	Mar 13, 2026	CodeCode Available
Reinforcement Learning for Diffusion LLMs with Entropy-Guided Step Selection and Stepwise Advantages	Mar 13, 2026	CodeCode Available
Multiscale Structure-Guided Latent Diffusion for Multimodal MRI Translation	Mar 13, 2026	CodeCode Available
Swap-guided Preference Learning for Personalized Reinforcement Learning from Human Feedback	Mar 13, 2026	CodeCode Available
Automatic Labelling for Low-Light Pedestrian Detection	Mar 13, 2026	CodeCode Available
Think with 3D: Geometric Imagination Grounded Spatial Reasoning from Limited Views	Mar 13, 2026	CodeCode Available
Parameterized Prompt for Incremental Object Detection	Mar 13, 2026	CodeCode Available
GraphPilot: Grounded Scene Graph Conditioning for Language-Based Autonomous Driving	Mar 13, 2026	CodeCode Available
AnatomiX, an Anatomy-Aware Grounded Multimodal Large Language Model for Chest X-Ray Interpretation	Mar 13, 2026	CodeCode Available
BitDance: Scaling Autoregressive Generative Models with Binary Tokens	Mar 13, 2026	CodeCode Available
Follow the Saliency: Supervised Saliency for Retrieval-augmented Dense Video Captioning	Mar 13, 2026	CodeCode Available
SODA: Sensitivity-Oriented Dynamic Acceleration for Diffusion Transformer	Mar 13, 2026	CodeCode Available
CMHANet: A Cross-Modal Hybrid Attention Network for Point Cloud Registration	Mar 13, 2026	CodeCode Available