The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2751–2775 of 661570 papers

Title	Date	Status
KG-Hopper: Empowering Compact Open LLMs with Knowledge Graph Reasoning via Reinforcement Learning	Mar 22, 2026	—Unverified
Beyond Static Visual Tokens: Structured Sequential Visual Chain-of-Thought Reasoning	Mar 21, 2026	—Unverified
Distilled Large Language Model-Driven Dynamic Sparse Expert Activation Mechanism	Mar 21, 2026	—Unverified
Ordinal Semantic Segmentation Applied to Medical and Odontological Images	Mar 21, 2026	—Unverified
Errors in AI-Assisted Retrieval of Medical Literature: A Comparative Study	Mar 21, 2026	—Unverified
T-MAP: Red-Teaming LLM Agents with Trajectory-aware Evolutionary Search	Mar 21, 2026	—Unverified
Neutrino Oscillation Parameter Estimation Using Structured Hierarchical Transformers	Mar 21, 2026	—Unverified
Causal Direct Preference Optimization for Distributionally Robust Generative Recommendation	Mar 21, 2026	—Unverified
Graphs RAG at Scale: Beyond Retrieval-Augmented Generation With Labeled Property Graphs and Resource Description Framework for Complex and Unknown Search Spaces	Mar 21, 2026	—Unverified
Implicit Turn-Wise Policy Optimization for Proactive User-LLM Interaction	Mar 21, 2026	—Unverified
Subject Information Extraction for Novelty Detection with Domain Shifts	Mar 21, 2026	—Unverified
LJ-Bench: Ontology-Based Benchmark for U.S. Crime	Mar 21, 2026	—Unverified
Context Cartography: Toward Structured Governance of Contextual Space in Large Language Model Systems	Mar 21, 2026	—Unverified
Position: Multi-Agent Algorithmic Care Systems Demand Contestability for Trustworthy AI	Mar 21, 2026	—Unverified
Graph-based data-driven discovery of interpretable laws governing corona-induced noise and radio interference for high-voltage transmission lines	Mar 21, 2026	—Unverified
Interpretable Operator Learning for Inverse Problems via Adaptive Spectral Filtering: Convergence and Discretization Invariance	Mar 21, 2026	—Unverified
Bayesian Learning in Episodic Zero-Sum Games	Mar 21, 2026	—Unverified
Towards Practical World Model-based Reinforcement Learning for Vision-Language-Action Models	Mar 21, 2026	—Unverified
GaussianPile: A Unified Sparse Gaussian Splatting Framework for Slice-based Volumetric Reconstruction	Mar 21, 2026	—Unverified
Beyond Token Eviction: Mixed-Dimension Budget Allocation for Efficient KV Cache Compression	Mar 21, 2026	—Unverified
Where can AI be used? Insights from a deep ontology of work activities	Mar 21, 2026	—Unverified
Reasoning Traces Shape Outputs but Models Won't Say So	Mar 21, 2026	—Unverified
LassoFlexNet: Flexible Neural Architecture for Tabular Data	Mar 21, 2026	—Unverified
Optimal low-rank stochastic gradient estimation for LLM training	Mar 21, 2026	—Unverified
Seed1.8 Model Card: Towards Generalized Real-World Agency	Mar 21, 2026	—Unverified