The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 701–750 of 659983 papers

Title	Date	Status
When Visuals Aren't the Problem: Evaluating Vision-Language Models on Misleading Data Visualizations	Mar 23, 2026	—Unverified
SynLeaF: A Dual-Stage Multimodal Fusion Framework for Synthetic Lethality Prediction Across Pan- and Single-Cancer Contexts	Mar 23, 2026	—Unverified
Causal Evidence that Language Models use Confidence to Drive Behavior	Mar 23, 2026	—Unverified
Seeing is Improving: Visual Feedback for Iterative Text Layout Refinement	Mar 23, 2026	—Unverified
SPA: A Simple but Tough-to-Beat Baseline for Knowledge Injection	Mar 23, 2026	—Unverified
Evaluating the Reliability and Fidelity of Automated Judgment Systems of Large Language Models	Mar 23, 2026	—Unverified
Gumbel Distillation for Parallel Text Generation	Mar 23, 2026	—Unverified
Noise Titration: Exact Distributional Benchmarking for Probabilistic Time Series Forecasting	Mar 23, 2026	—Unverified
Dyadic: A Scalable Platform for Human-Human and Human-AI Conversation Research	Mar 23, 2026	—Unverified
SpatialReward: Verifiable Spatial Reward Modeling for Fine-Grained Spatial Consistency in Text-to-Image Generation	Mar 23, 2026	—Unverified
TiCo: Time-Controllable Training for Spoken Dialogue Models	Mar 23, 2026	—Unverified
The Dual Mechanisms of Spatial Reasoning in Vision-Language Models	Mar 23, 2026	—Unverified
3D-Layout-R1: Structured Reasoning for Language-Instructed Spatial Editing	Mar 23, 2026	—Unverified
WorldCache: Content-Aware Caching for Accelerated Video World Models	Mar 23, 2026	—Unverified
Generating and Evaluating Sustainable Procurement Criteria for the Swiss Public Sector using In-Context Prompting with Large Language Models	Mar 23, 2026	—Unverified
Generalized multi-object classification and tracking with sparse feature resonator networks	Mar 23, 2026	—Unverified
Maximum Entropy Relaxation of Multi-Way Cardinality Constraints for Synthetic Population Generation	Mar 23, 2026	—Unverified
A vision-language model and platform for temporally mapping surgery from video	Mar 23, 2026	—Unverified
A Foundation Model for Instruction-Conditioned In-Context Time Series Tasks	Mar 23, 2026	—Unverified
flexvec: SQL Vector Retrieval with Programmatic Embedding Modulation	Mar 23, 2026	—Unverified
Precision-Varying Prediction (PVP): Robustifying ASR systems against adversarial attacks	Mar 23, 2026	—Unverified
TrajLoom: Dense Future Trajectory Generation from Video	Mar 23, 2026	—Unverified
Dress-ED: Instruction-Guided Editing for Virtual Try-On and Try-Off	Mar 23, 2026	—Unverified
Understanding LLM Performance Degradation in Multi-Instance Processing: The Roles of Instance Count and Context Length	Mar 23, 2026	—Unverified
Do Consumers Accept AIs as Moral Compliance Agents?	Mar 23, 2026	—Unverified
Bridging the Know-Act Gap via Task-Level Autoregressive Reasoning	Mar 23, 2026	—Unverified
Causal Discovery in Action: Learning Chain-Reaction Mechanisms from Interventions	Mar 23, 2026	—Unverified
Transfer learning via interpolating structures	Mar 23, 2026	—Unverified
A Vision Language Model for Generating Procedural Plant Architecture Representations from Simulated Images	Mar 23, 2026	—Unverified
To Agree or To Be Right? The Grounding-Sycophancy Tradeoff in Medical Vision-Language Models	Mar 23, 2026	—Unverified
Toward Faithful Segmentation Attribution via Benchmarking and Dual-Evidence Fusion	Mar 23, 2026	—Unverified
PIVM: Diffusion-Based Prior-Integrated Variation Modeling for Anatomically Precise Abdominal CT Synthesis	Mar 23, 2026	—Unverified
Learning to Trust: How Humans Mentally Recalibrate AI Confidence Signals	Mar 23, 2026	—Unverified
FAAR: Format-Aware Adaptive Rounding for NVFP4	Mar 23, 2026	—Unverified
Rethinking Multimodal Fusion for Time Series: Auxiliary Modalities Need Constrained Fusion	Mar 23, 2026	—Unverified
Three Creates All: You Only Sample 3 Steps	Mar 23, 2026	—Unverified
AI Co-Scientist for Ranking: Discovering Novel Search Ranking Models alongside LLM-based AI Agents with Cloud Computing Access	Mar 23, 2026	—Unverified
Latent Style-based Quantum Wasserstein GAN for Drug Design	Mar 23, 2026	—Unverified
Probabilistic modeling over permutations using quantum computers	Mar 23, 2026	—Unverified
Computational Arbitrage in AI Model Markets	Mar 23, 2026	—Unverified
Spatially-Aware Evaluation Framework for Aerial LiDAR Point Cloud Semantic Segmentation: Distance-Based Metrics on Challenging Regions	Mar 23, 2026	—Unverified
OsteoFlow: Lyapunov-Guided Flow Distillation for Predicting Bone Remodeling after Mandibular Reconstruction	Mar 23, 2026	—Unverified
Stability-Preserving Online Adaptation of Neural Closed-loop Maps	Mar 23, 2026	—Unverified
Do Large Language Models Reduce Research Novelty? Evidence from Information Systems Journals	Mar 23, 2026	—Unverified
Hebbian Attractor Networks for Robot Locomotion	Mar 23, 2026	—Unverified
Efficient Universal Perception Encoder	Mar 23, 2026	—Unverified
Static Scene Reconstruction from Dynamic Egocentric Videos	Mar 23, 2026	—Unverified
Towards Automated Community Notes Generation with Large Vision Language Models for Combating Contextual Deception	Mar 23, 2026	—Unverified
Enhancing Document-Level Machine Translation via Filtered Synthetic Corpora and Two-Stage LLM Adaptation	Mar 23, 2026	—Unverified
MAGPI: Multifidelity-Augmented Gaussian Process Inputs for Surrogate Modeling from Scarce Data	Mar 23, 2026	—Unverified