The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2001–2050 of 659983 papers

Title	Date	Status
A Theoretical Comparison of No-U-Turn Sampler Variants: Necessary and Su?cient Convergence Conditions and Mixing Time Analysis under Gaussian Targets	Mar 19, 2026	—Unverified
Click-to-Ask: An AI Live Streaming Assistant with Offline Copywriting and Online Interactive QA	Mar 19, 2026	—Unverified
Cognitive Amplification vs Cognitive Delegation in Human-AI Systems: A Metric Framework	Mar 19, 2026	—Unverified
Towards High-Quality Image Segmentation: Improving Topology Accuracy by Penalizing Neighbor Pixels	Mar 19, 2026	—Unverified
MANAR: Memory-augmented Attention with Navigational Abstract Conceptual Representation	Mar 19, 2026	—Unverified
Revisiting Label Inference Attacks in Vertical Federated Learning: Why They Are Vulnerable and How to Defend	Mar 19, 2026	—Unverified
HISR: Hindsight Information Modulated Segmental Process Rewards For Multi-turn Agentic Reinforcement Learning	Mar 19, 2026	—Unverified
OCP: Orthogonal Constrained Projection for Sparse Scaling in Industrial Commodity Recommendation	Mar 19, 2026	—Unverified
Off-Policy Learning with Limited Supply	Mar 19, 2026	—Unverified
Accurate and Efficient Multi-Channel Time Series Forecasting via Sparse Attention Mechanism	Mar 19, 2026	—Unverified
Analysis Of Linguistic Stereotypes in Single and Multi-Agent Generative AI Architectures	Mar 19, 2026	—Unverified
CausalRM: Causal-Theoretic Reward Modeling for RLHF from Observational User Feedbacks	Mar 19, 2026	—Unverified
Conflict-Based Search for Multi Agent Path Finding with Asynchronous Actions	Mar 19, 2026	—Unverified
Quantitative Introspection in Language Models: Tracking Internal States Across Conversation	Mar 19, 2026	—Unverified
EdgeCrafter: Compact ViTs for Edge Dense Prediction via Task-Specialized Distillation	Mar 19, 2026	—Unverified
6Bit-Diffusion: Inference-Time Mixed-Precision Quantization for Video Diffusion Models	Mar 19, 2026	—Unverified
Are complicated loss functions necessary for teaching LLMs to reason?	Mar 19, 2026	—Unverified
DA-Mamba: Learning Domain-Aware State Space Model for Global-Local Alignment in Domain Adaptive Object Detection	Mar 19, 2026	—Unverified
ClawTrap: A MITM-Based Red-Teaming Framework for Real-World OpenClaw Security Evaluation	Mar 19, 2026	—Unverified
A Concept is More Than a Word: Diversified Unlearning in Text-to-Image Diffusion Models	Mar 19, 2026	—Unverified
Automatic Configuration of LLM Post-Training Pipelines	Mar 19, 2026	—Unverified
Points-to-3D: Structure-Aware 3D Generation with Point Cloud Priors	Mar 19, 2026	—Unverified
Proceedings of the 2nd Workshop on Advancing Artificial Intelligence through Theory of Mind	Mar 19, 2026	—Unverified
Mi:dm K 2.5 Pro	Mar 19, 2026	—Unverified
Rethinking Uncertainty Quantification and Entanglement in Image Segmentation	Mar 19, 2026	—Unverified
Functional Subspace Watermarking for Large Language Models	Mar 19, 2026	—Unverified
Perceptio: Perception Enhanced Vision Language Models via Spatial Token Generation	Mar 19, 2026	—Unverified
VesselTok: Tokenizing Vessel-like 3D Biomedical Graph Representations for Reconstruction and Generation	Mar 19, 2026	—Unverified
Signals of Success and Struggle: Early Prediction and Physiological Signatures of Human Performance across Task Complexity	Mar 19, 2026	—Unverified
dTRPO: Trajectory Reduction in Policy Optimization of Diffusion Large Language Models	Mar 19, 2026	—Unverified
Learn for Variation: Variationally Guided AAV Trajectory Learning in Differentiable Environments	Mar 19, 2026	—Unverified
Data-driven construction of machine-learning-based interatomic potentials for gas-surface scattering dynamics: the case of NO on graphite	Mar 19, 2026	—Unverified
RadioDiff-FS: Physics-Informed Manifold Alignment in Few-Shot Diffusion Models for High-Fidelity Radio Map Construction	Mar 19, 2026	—Unverified
Through the Looking-Glass: AI-Mediated Video Communication Reduces Interpersonal Trust and Confidence in Judgments	Mar 19, 2026	—Unverified
MultihopSpatial: Multi-hop Compositional Spatial Reasoning Benchmark for Vision-Language Model	Mar 19, 2026	—Unverified
Evaluating LLM-Generated Lessons from the Language Learning Students' Perspective: A Short Case Study on Duolingo	Mar 19, 2026	—Unverified
Geography According to ChatGPT -- How Generative AI Represents and Reasons about Geography	Mar 19, 2026	—Unverified
Revisiting Autoregressive Models for Generative Image Classification	Mar 19, 2026	—Unverified
Reasoning over mathematical objects: on-policy reward modeling and test time aggregation	Mar 19, 2026	—Unverified
A conceptual framework for ideology beyond the left and right	Mar 19, 2026	—Unverified
Authority-Level Priors: An Under-Specified Constraint in Hierarchical Predictive Processing	Mar 19, 2026	—Unverified
Context Bootstrapped Reinforcement Learning	Mar 19, 2026	—Unverified
Unsupervised Contrastive Learning for Efficient and Robust Spectral Shape Matching	Mar 19, 2026	—Unverified
Neural Galerkin Normalizing Flow for Transition Probability Density Functions of Diffusion Models	Mar 19, 2026	—Unverified
Secure Linear Alignment of Large Language Models	Mar 19, 2026	—Unverified
Security, privacy, and agentic AI in a regulatory view: From definitions and distinctions to provisions and reflections	Mar 19, 2026	—Unverified
Agentic Business Process Management: A Research Manifesto	Mar 19, 2026	—Unverified
Improving moment tensor solutions under Earth structure uncertainty with simulation-based inference	Mar 19, 2026	—Unverified
An Optimised Greedy-Weighted Ensemble Framework for Financial Loan Default Prediction	Mar 19, 2026	—Unverified
Entropy trajectory shape predicts LLM reasoning reliability: A diagnostic study of uncertainty dynamics in chain-of-thought	Mar 19, 2026	—Unverified