The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8201–8250 of 661570 papers

Title	Date	Status
Time series forecasting with Hahn Kolmogorov-Arnold networks	Mar 10, 2026	—Unverified
Structured Matrix Scaling for Multi-Class Calibration	Mar 10, 2026	—Unverified
Memorization capacity of deep ReLU neural networks characterized by width and depth	Mar 10, 2026	—Unverified
SimpleQA Verified: A Reliable Factuality Benchmark to Measure Parametric Knowledge	Mar 10, 2026	—Unverified
TSFM in-context learning for time-series classification of bearing-health status	Mar 10, 2026	—Unverified
Training-Free Coverless Multi-Image Steganography with Access Control	Mar 10, 2026	—Unverified
Quantifying the Necessity of Chain of Thought through Opaque Serial Depth	Mar 10, 2026	—Unverified
From Prior to Pro: Efficient Skill Mastery via Distribution Contractive RL Finetuning	Mar 10, 2026	—Unverified
FreqCycle: A Multi-Scale Time-Frequency Analysis Method for Time Series Forecasting	Mar 10, 2026	—Unverified
Improving 3D Foot Motion Reconstruction in Markerless Monocular Human Motion Capture	Mar 10, 2026	—Unverified
Influencing LLM Multi-Agent Dialogue via Policy-Parameterized Prompts	Mar 10, 2026	—Unverified
Calibration-Reasoning Framework for Descriptive Speech Quality Assessment	Mar 10, 2026	—Unverified
GSStream: 3D Gaussian Splatting based Volumetric Scene Streaming System	Mar 10, 2026	—Unverified
Governance Architecture for Autonomous Agent Systems: Threats, Framework, and Engineering Practice	Mar 10, 2026	—Unverified
No evaluation without fair representation : Impact of label and selection bias on the evaluation, performance and mitigation of classification models	Mar 10, 2026	—Unverified
Large Spikes in Stochastic Gradient Descent: A Large-Deviations View	Mar 10, 2026	—Unverified
A Graph-Based Approach to Spectrum Demand Prediction Using Hierarchical Attention Networks	Mar 10, 2026	—Unverified
Singing Syllabi with Virtual Avatars: Enhancing Student Engagement Through AI-Generated Music and Digital Embodiment	Mar 10, 2026	—Unverified
Removing the Trigger, Not the Backdoor: Alternative Triggers and Latent Backdoors	Mar 10, 2026	—Unverified
Global universality via discrete-time signatures	Mar 10, 2026	—Unverified
Why LLMs Fail: A Failure Analysis and Partial Success Measurement for Automated Security Patch Generation	Mar 10, 2026	—Unverified
CRANE: Causal Relevance Analysis of Language-Specific Neurons in Multilingual Large Language Models	Mar 10, 2026	—Unverified
ParTY: Part-Guidance for Expressive Text-to-Motion Synthesis	Mar 10, 2026	—Unverified
VarSplat: Uncertainty-aware 3D Gaussian Splatting for Robust RGB-D SLAM	Mar 10, 2026	—Unverified
ReCoSplat: Autoregressive Feed-Forward Gaussian Splatting Using Render-and-Compare	Mar 10, 2026	—Unverified
Digging Deeper: Learning Multi-Level Concept Hierarchies	Mar 10, 2026	—Unverified
Common Sense vs. Morality: The Curious Case of Narrative Focus Bias in LLMs	Mar 10, 2026	—Unverified
a-TMFG: Scalable Triangulated Maximally Filtered Graphs via Approximate Nearest Neighbors	Mar 10, 2026	—Unverified
Learning Transferable Skills in Action RPGs via Directed Skill Graphs and Selective Adaptation	Mar 10, 2026	—Unverified
Marginals Before Conditionals	Mar 10, 2026	—Unverified
GR-SAP: Generative Replay for Safety Alignment Preservation during Fine-Tuning	Mar 10, 2026	CodeCode Available
MMGraphRAG: Bridging Vision and Language with Interpretable Multimodal Knowledge Graphs	Mar 10, 2026	—Unverified
Learning Encoding-Decoding Direction Pairs to Unveil Concepts of Influence in Deep Vision Networks	Mar 10, 2026	—Unverified
MKE-Coder: Multi-Axial Knowledge with Evidence Verification in ICD Coding for Chinese EMRs	Mar 10, 2026	—Unverified
Experiments with Optimal Model Trees	Mar 10, 2026	—Unverified
Pure Exploration with Infinite Answers	Mar 10, 2026	—Unverified
TaoSR1: The Thinking Model for E-commerce Relevance Search	Mar 10, 2026	—Unverified
On the mechanical creation of mathematical concepts	Mar 10, 2026	—Unverified
VistaWise: Building Cost-Effective Agent with Cross-Modal Knowledge Graph for Minecraft	Mar 10, 2026	—Unverified
AgentCoMa: A Compositional Benchmark Mixing Commonsense and Mathematical Reasoning in Real-World Scenarios	Mar 10, 2026	—Unverified
Iterative In-Context Learning to Enhance LLMs Abstract Reasoning: The Case-Study of Algebraic Tasks	Mar 10, 2026	—Unverified
Intrinsic Numerical Robustness and Fault Tolerance in a Neuromorphic Algorithm for Scientific Computing	Mar 10, 2026	—Unverified
Automatic Paper Reviewing with Heterogeneous Graph Reasoning over LLM-Simulated Reviewer-Author Debates	Mar 10, 2026	—Unverified
CoRe-GS: Coarse-to-Refined Gaussian Splatting with Semantic Object Focus	Mar 10, 2026	—Unverified
Repulsive Monte Carlo on the sphere for the sliced Wasserstein distance	Mar 10, 2026	—Unverified
VoiceBridge: General Speech Restoration with One-step Latent Bridge Models	Mar 10, 2026	—Unverified
Reasoning Efficiently Through Adaptive Chain-of-Thought Compression: A Self-Optimizing Framework	Mar 10, 2026	—Unverified
Kuramoto Orientation Diffusion Models	Mar 10, 2026	—Unverified
Periodic Asynchrony: An On-Policy Approach for Accelerating LLM Reinforcement Learning	Mar 10, 2026	—Unverified
LLaVAShield: Safeguarding Multimodal Multi-Turn Dialogues in Vision-Language Models	Mar 10, 2026	—Unverified