The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 474278 papers

Title	Date	Status
Are LLM-Enhanced Graph Neural Networks Robust against Poisoning Attacks?	Mar 27, 2026	—Unverified
LLM Benchmark-User Need Misalignment for Climate Change	Mar 27, 2026	—Unverified
Gaussian Shannon: High-Precision Diffusion Model Watermarking Based on Communication	Mar 27, 2026	—Unverified
OSA: Echocardiography Video Segmentation via Orthogonalized State Update and Anatomical Prior-aware Feature Enhancement	Mar 27, 2026	—Unverified
CALRK-Bench: Evaluating Context-Aware Legal Reasoning in Korean Law	Mar 27, 2026	—Unverified
HINT: Composed Image Retrieval with Dual-path Compositional Contextualized Network	Mar 27, 2026	—Unverified
From Static to Dynamic: Exploring Self-supervised Image-to-Video Representation Transfer Learning	Mar 27, 2026	—Unverified
MPDiT: Multi-Patch Global-to-Local Transformer Architecture For Efficient Flow Matching and Diffusion Model	Mar 27, 2026	—Unverified
KMM-CP: Practical Conformal Prediction under Covariate Shift via Selective Kernel Mean Matching	Mar 27, 2026	—Unverified
Analysing Calls to Order in German Parliamentary Debates	Mar 27, 2026	—Unverified
UNIFERENCE: A Discrete Event Simulation Framework for Developing Distributed AI Models	Mar 27, 2026	—Unverified
Make Geometry Matter for Spatial Reasoning	Mar 27, 2026	—Unverified
AFSS: Artifact-Focused Self-Synthesis for Mitigating Bias in Audio Deepfake Detection	Mar 27, 2026	—Unverified
Beyond Textual Knowledge-Leveraging Multimodal Knowledge Bases for Enhancing Vision-and-Language Navigation	Mar 27, 2026	—Unverified
Unified Number-Free Text-to-Motion Generation Via Flow Matching	Mar 27, 2026	—Unverified
PixelSmile: Toward Fine-Grained Facial Expression Editing	Mar 26, 2026	—Unverified
PackForcing: Short Video Training Suffices for Long Video Sampling and Long Context Inference	Mar 26, 2026	—Unverified
Can Users Specify Driving Speed? Bench2Drive-Speed: Benchmark and Baselines for Desired-Speed Conditioned Autonomous Driving	Mar 26, 2026	—Unverified
No Hard Negatives Required: Concept Centric Learning Leads to Compositionality without Degrading Zero-shot Capabilities of Contrastive Models	Mar 26, 2026	—Unverified
Focus-to-Perceive Representation Learning: A Cognition-Inspired Hierarchical Framework for Endoscopic Video Analysis	Mar 26, 2026	—Unverified
Density-aware Soft Context Compression with Semi-Dynamic Compression Ratio	Mar 26, 2026	—Unverified
Adapting Segment Anything Model 3 for Concept-Driven Lesion Segmentation in Medical Images: An Experimental Study	Mar 26, 2026	—Unverified
Low-Rank-Modulated Functa: Exploring the Latent Space of Implicit Neural Representations for Interpretable Ultrasound Video Analysis	Mar 26, 2026	—Unverified
Revisiting On-Policy Distillation: Empirical Failure Modes and Simple Fixes	Mar 26, 2026	—Unverified
MuRF: Unlocking the Multi-Scale Potential of Vision Foundation Models	Mar 26, 2026	—Unverified
ShotStream: Streaming Multi-Shot Video Generation for Interactive Storytelling	Mar 26, 2026	—Unverified
RealChart2Code: Advancing Chart-to-Code Generation with Real Data and Multi-Task Evaluation	Mar 26, 2026	—Unverified
GazeQwen: Lightweight Gaze-Conditioned LLM Modulation for Streaming Video Understanding	Mar 26, 2026	—Unverified
Anchored-Branched Steady-state WInd Flow Transformer (AB-SWIFT): a metamodel for 3D atmospheric flow in urban environments	Mar 26, 2026	—Unverified
S2D2: Fast Decoding for Diffusion LLMs via Training-Free Self-Speculation	Mar 26, 2026	—Unverified
BEVMAPMATCH: Multimodal BEV Neural Map Matching for Robust Re-Localization of Autonomous Vehicles	Mar 26, 2026	—Unverified
Diffusion MRI Transformer with a Diffusion Space Rotary Positional Embedding (D-RoPE)	Mar 26, 2026	—Unverified
World Reasoning Arena	Mar 26, 2026	—Unverified
Dictionary-based Pathology Mining with Hard-instance-assisted Classifier Debiasing for Genetic Biomarker Prediction from WSIs	Mar 26, 2026	—Unverified
RS-SSM: Refining Forgotten Specifics in State Space Model for Video Semantic Segmentation	Mar 26, 2026	—Unverified
Can MLLMs Read Students' Minds? Unpacking Multimodal Error Analysis in Handwritten Math	Mar 26, 2026	—Unverified
Learning Explicit Continuous Motion Representation for Dynamic Gaussian Splatting from Monocular Videos	Mar 26, 2026	—Unverified
Robust Principal Component Completion	Mar 26, 2026	—Unverified
MSRL: Scaling Generative Multimodal Reward Modeling via Multi-Stage Reinforcement Learning	Mar 26, 2026	—Unverified
MCLMR: A Model-Agnostic Causal Learning Framework for Multi-Behavior Recommendation	Mar 26, 2026	—Unverified
UniAI-GraphRAG: Synergizing Ontology-Guided Extraction, Multi-Dimensional Clustering, and Dual-Channel Fusion for Robust Multi-Hop Reasoning	Mar 26, 2026	—Unverified
AG-EgoPose: Leveraging Action-Guided Motion and Kinematic Joint Encoding for Egocentric 3D Pose Estimation	Mar 26, 2026	—Unverified
VolDiT: Controllable Volumetric Medical Image Synthesis with Diffusion Transformers	Mar 26, 2026	—Unverified
WebTestBench: Evaluating Computer-Use Agents towards End-to-End Automated Web Testing	Mar 26, 2026	—Unverified
Activation Matters: Test-time Activated Negative Labels for OOD Detection with Vision-Language Models	Mar 26, 2026	—Unverified
EagleNet: Energy-Aware Fine-Grained Relationship Learning Network for Text-Video Retrieval	Mar 26, 2026	—Unverified
CRAFT: Grounded Multi-Agent Coordination Under Partial Information	Mar 26, 2026	—Unverified
V2U4Real: A Real-world Large-scale Dataset for Vehicle-to-UAV Cooperative Perception	Mar 26, 2026	—Unverified
HeSS: Head Sensitivity Score for Sparsity Redistribution in VGGT	Mar 26, 2026	—Unverified
From Intent to Evidence: A Categorical Approach for Structural Evaluation of Deep Research Agents	Mar 26, 2026	—Unverified