The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4751–4775 of 661570 papers

Title	Date	Status
Transformers are Bayesian Networks	Mar 17, 2026	—Unverified
TrackDeform3D: Markerless and Autonomous 3D Keypoint Tracking and Dataset Collection for Deformable Objects	Mar 17, 2026	—Unverified
Large Reasoning Models Struggle to Transfer Parametric Knowledge Across Scripts	Mar 17, 2026	—Unverified
PRISM: Demystifying Retention and Interaction in Mid-Training	Mar 17, 2026	—Unverified
Evaluating LLM-Simulated Conversations in Modeling Inconsistent and Uncollaborative Behaviors in Human Social Interaction	Mar 17, 2026	—Unverified
An End-to-End Framework for Functionality-Embedded Provenance Graph Construction and Threat Interpretation	Mar 17, 2026	—Unverified
Knowledge Localization in Mixture-of-Experts LLMs Using Cross-Lingual Inconsistency	Mar 17, 2026	—Unverified
When the Specification Emerges: Benchmarking Faithfulness Loss in Long-Horizon Coding Agents	Mar 17, 2026	—Unverified
SENSE: Efficient EEG-to-Text via Privacy-Preserving Semantic Retrieval	Mar 17, 2026	—Unverified
Pixel-level Counterfactual Contrastive Learning for Medical Image Segmentation	Mar 17, 2026	—Unverified
Hidden Clones: Exposing and Fixing Family Bias in Vision-Language Model Ensembles	Mar 17, 2026	—Unverified
MosaicMem: Hybrid Spatial Memory for Controllable Video World Models	Mar 17, 2026	—Unverified
Security Assessment and Mitigation Strategies for Large Language Models: A Comprehensive Defensive Framework	Mar 17, 2026	—Unverified
Topology-Preserving Deep Joint Source-Channel Coding for Semantic Communication	Mar 17, 2026	—Unverified
Personalized Fall Detection by Balancing Data with Selective Feedback Using Contrastive Learning	Mar 17, 2026	—Unverified
Intent Formalization: A Grand Challenge for Reliable Coding in the Age of AI Agents	Mar 17, 2026	—Unverified
GazeOnce360: Fisheye-Based 360° Multi-Person Gaze Estimation with Global-Local Feature Fusion	Mar 17, 2026	—Unverified
Quadratic Surrogate Attractor for Particle Swarm Optimization	Mar 17, 2026	—Unverified
SLAM Adversarial Lab: An Extensible Framework for Visual SLAM Robustness Evaluation under Adverse Conditions	Mar 17, 2026	—Unverified
PAuth - Precise Task-Scoped Authorization For Agents	Mar 17, 2026	—Unverified
Detecting Data Poisoning in Code Generation LLMs via Black-Box, Vulnerability-Oriented Scanning	Mar 17, 2026	—Unverified
Domain-informed explainable boosting machines for trustworthy lateral spread predictions	Mar 17, 2026	—Unverified
Catching rationalization in the act: detecting motivated reasoning before and after CoT via activation probing	Mar 17, 2026	—Unverified
Visual Product Search Benchmark	Mar 17, 2026	—Unverified
Abstraction as a Memory-Efficient Inductive Bias for Continual Learning	Mar 17, 2026	—Unverified