The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7651–7700 of 661570 papers

Title	Date	Status	Hype
AI Psychometrics: Evaluating the Psychological Reasoning of Large Language Models with Psychometric Validities	Mar 11, 2026	—Unverified	0
Beyond Linearity in Attention Projections: The Case for Nonlinear Queries	Mar 11, 2026	—Unverified	0
Colony Grounded SAM2: Zero-shot detection and segmentation of bacterial colonies using foundation models	Mar 11, 2026	—Unverified	0
COT-FM: Cluster-wise Optimal Transport Flow Matching	Mar 11, 2026	—Unverified	0
DINOv3 with Test-Time Calibration for Automated Carotid Intima-Media Thickness Measurement on CUBS v1	Mar 11, 2026	—Unverified	0
Taming Vision Priors for Data Efficient mmWave Channel Modeling	Mar 11, 2026	—Unverified	0
VisualLeakBench: Auditing the Fragility of Large Vision-Language Models against PII Leakage and Social Engineering	Mar 11, 2026	—Unverified	0
Cylindrical Mechanical Projector for Omnidirectional Fringe Projection Profilometry	Mar 11, 2026	—Unverified	0
High-Fidelity Text-to-Image Generation from Pre-Trained Vision-Language Models via Distribution-Conditioned Diffusion Decoding	Mar 11, 2026	—Unverified	0
SERUM: Simple, Efficient, Robust, and Unifying Marking for Diffusion-based Image Generation	Mar 11, 2026	—Unverified	0
MAD: Microenvironment-Aware Distillation -- A Pretraining Strategy for Virtual Spatial Omics from Microscopy	Mar 11, 2026	—Unverified	0
Hybrid Intent-Aware Personalization with Machine Learning and RAG-Enabled Large Language Models for Financial Services Marketing	Mar 11, 2026	—Unverified	0
Citation-Enforced RAG for Fiscal Document Intelligence: Cited, Explainable Knowledge Retrieval in Tax Compliance	Mar 11, 2026	—Unverified	0
FlowAD: Ego-Scene Interactive Modeling for Autonomous Driving	Mar 11, 2026	—Unverified	0
Combining Microscopy Data and Metadata for Reconstruction of Cellular Traction Forces Using a Hybrid Vision Transformer-U-Net	Mar 11, 2026	—Unverified	0
WebVR: Benchmarking Multimodal LLMs for WebPage Recreation from Videos via Human-Aligned Visual Rubrics	Mar 11, 2026	—Unverified	0
Language-Guided Token Compression with Reinforcement Learning in Large Vision-Language Models	Mar 11, 2026	CodeCode Available	0
VulnAgent-X: A Layered Agentic Framework for Repository-Level Vulnerability Detection	Mar 11, 2026	CodeCode Available	0
VeloEdit: Training-Free Consistent and Continuous Instruction-Based Image Editing via Velocity Field Decomposition	Mar 11, 2026	CodeCode Available	0
Average Calibration Losses for Reliable Uncertainty in Medical Image Segmentation	Mar 11, 2026	CodeCode Available	0
Qianfan-OCR: A Unified End-to-End Model for Document Intelligence	Mar 11, 2026	—Unverified	3
Layout-Guided Controllable Pathology Image Generation with In-Context Diffusion Transformers	Mar 11, 2026	—Unverified	0
Client-Conditional Federated Learning via Local Training Data Statistics	Mar 11, 2026	—Unverified	0
Teleodynamic Learning a new Paradigm For Interpretable AI	Mar 11, 2026	—Unverified	0
The Artificial Self: Characterising the landscape of AI identity	Mar 11, 2026	—Unverified	0
Efficient Compositional Multi-tasking for On-device Large Language Models	Mar 11, 2026	—Unverified	0
Streamline pathology foundation model by cross-magnification distillation	Mar 11, 2026	—Unverified	0
UniFField: A Generalizable Unified Neural Feature Field for Visual, Semantic, and Spatial Uncertainties in Any Scene	Mar 11, 2026	—Unverified	0
DeepSport: A Multimodal Large Language Model for Comprehensive Sports Video Reasoning via Agentic Reinforcement Learning	Mar 11, 2026	—Unverified	0
Knowledge Distillation with Structured Chain-of-Thought for Text-to-SQL	Mar 11, 2026	—Unverified	0
Consistency of Large Reasoning Models Under Multi-Turn Attacks	Mar 11, 2026	—Unverified	0
Kernel-based optimization of measurement operators for quantum reservoir computers	Mar 11, 2026	—Unverified	0
Resolving Java Code Repository Issues with iSWE Agent	Mar 11, 2026	—Unverified	0
From Classical to Quantum: Extending Prometheus for Unsupervised Discovery of Phase Transitions in Three Dimensions and Quantum Systems	Mar 11, 2026	—Unverified	0
Unsupervised Discovery of Intermediate Phase Order in the Frustrated J_1-J_2 Heisenberg Model via Prometheus Framework	Mar 11, 2026	—Unverified	0
FlashOptim: Optimizers for Memory-Efficient Training	Mar 11, 2026	—Unverified	0
Computational Pathology in the Era of Emerging Foundation and Agentic AI -- International Expert Perspectives on Clinical Integration and Translational Readiness	Mar 11, 2026	—Unverified	0
Evaluating LLM-Based Grant Proposal Review via Structured Perturbations	Mar 11, 2026	—Unverified	0
AgentOS: From Application Silos to a Natural Language-Driven Data Ecosystem	Mar 11, 2026	—Unverified	0
Duration Aware Scheduling for ASR Serving Under Workload Drift	Mar 11, 2026	—Unverified	0
Ghost Framing Theory: Exploring the role of generative AI in new venture rhetorical legitimation	Mar 11, 2026	—Unverified	0
Implicit Statistical Inference in Transformers: Approximating Likelihood-Ratio Tests In-Context	Mar 11, 2026	—Unverified	0
"I followed what felt right, not what I was told": Autonomy, Coaching, and Recognizing Bias Through AI-Mediated Dialogue	Mar 11, 2026	—Unverified	0
RIE-Greedy: Regularization-Induced Exploration for Contextual Bandits	Mar 11, 2026	—Unverified	0
Counterweights and Complementarities: The Convergence of AI and Blockchain Powering a Decentralized Future	Mar 11, 2026	—Unverified	0
Worst-case low-rank approximations	Mar 11, 2026	—Unverified	0
Hindsight-Anchored Policy Optimization: Turning Failure into Feedback in Sparse Reward Settings	Mar 11, 2026	—Unverified	0
Heavy-Tailed Principle Component Analysis	Mar 11, 2026	—Unverified	0
MRI2Qmap: multi-parametric quantitative mapping with MRI-driven denoising priors	Mar 11, 2026	—Unverified	0
UniCompress: Token Compression for Unified Vision-Language Understanding and Generation	Mar 11, 2026	—Unverified	0