The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11951–12000 of 661570 papers

Title	Date	Status	Hype
Tether: Autonomous Functional Play with Correspondence-Driven Trajectory Warping	Mar 3, 2026	—Unverified	0
ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation	Mar 3, 2026	—Unverified	0
How to Peel with a Knife: Aligning Fine-Grained Manipulation with Human Preference	Mar 3, 2026	—Unverified	0
MIBURI: Towards Expressive Interactive Gesture Synthesis	Mar 3, 2026	—Unverified	0
Utonia: Toward One Encoder for All Point Clouds	Mar 3, 2026	—Unverified	4
Q-Guided Stein Variational Model Predictive Control via RL-informed Policy Prior	Mar 3, 2026	—Unverified	0
Classification of Histopathology Slides with Persistent Homology Convolutions	Mar 3, 2026	—Unverified	0
HAMLET: A Hierarchical and Adaptive Multi-Agent Framework for Live Embodied Theatrics	Mar 3, 2026	—Unverified	0
Effective Sample Size and Generalization Bounds for Temporal Networks	Mar 3, 2026	—Unverified	0
CAD-Tokenizer: Towards Text-based CAD Prototyping via Modality-Specific Tokenization	Mar 3, 2026	—Unverified	0
Uni-NTFM: A Unified Foundation Model for EEG Signal Representation Learning	Mar 3, 2026	—Unverified	0
FLOWR.root: A flow matching based foundation model for joint multi-purpose structure-aware 3D ligand generation and affinity prediction	Mar 3, 2026	—Unverified	0
The Geometry of Reasoning: Flowing Logics in Representation Space	Mar 3, 2026	—Unverified	1
A Geometry-Based View of Mahalanobis OOD Detection	Mar 3, 2026	—Unverified	0
UniLight: A Unified Representation for Lighting	Mar 3, 2026	—Unverified	0
CNFP: Optimizing Cloud-Native Network Function Placement with Diffusion Models on the Cloud Continuum	Mar 3, 2026	—Unverified	0
Implicit Bias of the JKO Scheme	Mar 3, 2026	—Unverified	0
BumpNet: A Sparse MLP Framework for Learning PDE Solutions	Mar 3, 2026	—Unverified	0
The Epistemological Consequences of Large Language Models: Rethinking collective intelligence and institutional knowledge	Mar 3, 2026	—Unverified	0
LeanTutor: Towards a Verified AI Mathematical Proof Tutor	Mar 3, 2026	—Unverified	0
Causal Identification from Counterfactual Data: Completeness and Bounding Results	Mar 3, 2026	—Unverified	0
GENAI WORKBENCH: AI-Assisted Analysis and Synthesis of Engineering Systems from Multimodal Engineering Data	Mar 3, 2026	—Unverified	0
Surprisal-Rényi Free Energy	Mar 3, 2026	—Unverified	0
LiteVLA-Edge: Quantized On-Device Multimodal Control for Embedded Robotics	Mar 3, 2026	—Unverified	0
Learning Order Forest for Qualitative-Attribute Data Clustering	Mar 3, 2026	—Unverified	0
Multi-Agent-Based Simulation of Archaeological Mobility in Uneven Landscapes	Mar 3, 2026	—Unverified	0
Zero-Knowledge Federated Learning with Lattice-Based Hybrid Encryption for Quantum-Resilient Medical AI	Mar 3, 2026	—Unverified	0
Beyond Cross-Validation: Adaptive Parameter Selection for Kernel-Based Gradient Descents	Mar 3, 2026	—Unverified	0
Heterogeneous Time Constants Improve Stability in Equilibrium Propagation	Mar 3, 2026	—Unverified	0
Tracing Pharmacological Knowledge In Large Language Models	Mar 3, 2026	—Unverified	0
Scalable Contrastive Causal Discovery under Unknown Soft Interventions	Mar 3, 2026	—Unverified	0
Parallel Test-Time Scaling with Multi-Sequence Verifiers	Mar 3, 2026	—Unverified	0
Beyond Accuracy: Evaluating Visual Grounding In Multimodal Medical Reasoning	Mar 3, 2026	—Unverified	0
Asymmetric Goal Drift in Coding Agents Under Value Conflict	Mar 3, 2026	—Unverified	0
Graph Hopfield Networks: Energy-Based Node Classification with Associative Memory	Mar 3, 2026	—Unverified	0
Biased Generalization in Diffusion Models	Mar 3, 2026	—Unverified	0
When Shallow Wins: Silent Failures and the Depth-Accuracy Paradox in Latent Reasoning	Mar 3, 2026	—Unverified	0
Beyond Pixel Histories: World Models with Persistent 3D State	Mar 3, 2026	—Unverified	0
Optimal trajectory-guided stochastic co-optimization for e-fuel system design and real-time operation	Mar 3, 2026	—Unverified	0
Quantifying Ranking Instability Across Evaluation Protocol Axes in Gene Regulatory Network Benchmarking	Mar 3, 2026	—Unverified	0
Geographically-Weighted Weakly Supervised Bayesian High-Resolution Transformer for 200m Resolution Pan-Arctic Sea Ice Concentration Mapping and Uncertainty Estimation using Sentinel-1, RCM, and AMSR2 Data	Mar 3, 2026	—Unverified	0
Raising Bars, Not Parameters: LilMoo Compact Language Model for Hindi	Mar 3, 2026	—Unverified	0
Orbital Transformers for Predicting Wavefunctions in Time-Dependent Density Functional Theory	Mar 3, 2026	—Unverified	0
The Controllability Trap: A Governance Framework for Military AI Agents	Mar 3, 2026	—Unverified	0
MMAI Gym for Science: Training Liquid Foundation Models for Drug Discovery	Mar 3, 2026	—Unverified	0
Q-Measure-Learning for Continuous State RL: Efficient Implementation and Convergence	Mar 3, 2026	—Unverified	0
Molt Dynamics: Emergent Social Phenomena in Autonomous AI Agent Populations	Mar 3, 2026	—Unverified	0
Multi-Agent Influence Diagrams to Hybrid Threat Modeling	Mar 3, 2026	—Unverified	0
Logit-Level Uncertainty Quantification in Vision-Language Models for Histopathology Image Analysis	Mar 3, 2026	—Unverified	0
Directional Neural Collapse Explains Few-Shot Transfer in Self-Supervised Learning	Mar 3, 2026	—Unverified	0