The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 701–725 of 659983 papers

Title	Date	Status
When Visuals Aren't the Problem: Evaluating Vision-Language Models on Misleading Data Visualizations	Mar 23, 2026	—Unverified
SynLeaF: A Dual-Stage Multimodal Fusion Framework for Synthetic Lethality Prediction Across Pan- and Single-Cancer Contexts	Mar 23, 2026	—Unverified
Causal Evidence that Language Models use Confidence to Drive Behavior	Mar 23, 2026	—Unverified
Seeing is Improving: Visual Feedback for Iterative Text Layout Refinement	Mar 23, 2026	—Unverified
SPA: A Simple but Tough-to-Beat Baseline for Knowledge Injection	Mar 23, 2026	—Unverified
Evaluating the Reliability and Fidelity of Automated Judgment Systems of Large Language Models	Mar 23, 2026	—Unverified
Gumbel Distillation for Parallel Text Generation	Mar 23, 2026	—Unverified
Noise Titration: Exact Distributional Benchmarking for Probabilistic Time Series Forecasting	Mar 23, 2026	—Unverified
Dyadic: A Scalable Platform for Human-Human and Human-AI Conversation Research	Mar 23, 2026	—Unverified
SpatialReward: Verifiable Spatial Reward Modeling for Fine-Grained Spatial Consistency in Text-to-Image Generation	Mar 23, 2026	—Unverified
TiCo: Time-Controllable Training for Spoken Dialogue Models	Mar 23, 2026	—Unverified
The Dual Mechanisms of Spatial Reasoning in Vision-Language Models	Mar 23, 2026	—Unverified
3D-Layout-R1: Structured Reasoning for Language-Instructed Spatial Editing	Mar 23, 2026	—Unverified
WorldCache: Content-Aware Caching for Accelerated Video World Models	Mar 23, 2026	—Unverified
Generating and Evaluating Sustainable Procurement Criteria for the Swiss Public Sector using In-Context Prompting with Large Language Models	Mar 23, 2026	—Unverified
Generalized multi-object classification and tracking with sparse feature resonator networks	Mar 23, 2026	—Unverified
Maximum Entropy Relaxation of Multi-Way Cardinality Constraints for Synthetic Population Generation	Mar 23, 2026	—Unverified
A vision-language model and platform for temporally mapping surgery from video	Mar 23, 2026	—Unverified
A Foundation Model for Instruction-Conditioned In-Context Time Series Tasks	Mar 23, 2026	—Unverified
flexvec: SQL Vector Retrieval with Programmatic Embedding Modulation	Mar 23, 2026	—Unverified
Precision-Varying Prediction (PVP): Robustifying ASR systems against adversarial attacks	Mar 23, 2026	—Unverified
TrajLoom: Dense Future Trajectory Generation from Video	Mar 23, 2026	—Unverified
Dress-ED: Instruction-Guided Editing for Virtual Try-On and Try-Off	Mar 23, 2026	—Unverified
Understanding LLM Performance Degradation in Multi-Instance Processing: The Roles of Instance Count and Context Length	Mar 23, 2026	—Unverified
Do Consumers Accept AIs as Moral Compliance Agents?	Mar 23, 2026	—Unverified