The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8401–8450 of 661570 papers

Title	Date	Status
Dissecting Chronos: Sparse Autoencoders Reveal Causal Feature Hierarchies in Time Series Foundation Models	Mar 10, 2026	—Unverified
ADVERSA: Measuring Multi-Turn Guardrail Degradation and Judge Reliability in Large Language Models	Mar 10, 2026	—Unverified
TASER: Task-Aware Spectral Energy Refine for Backdoor Suppression in UAV Swarms Decentralized Federated Learning	Mar 10, 2026	—Unverified
Stochastic Port-Hamiltonian Neural Networks: Universal Approximation with Passivity Guarantees	Mar 10, 2026	—Unverified
Mitigating Frequency Learning Bias in Quantum Models via Multi-Stage Residual Learning	Mar 10, 2026	—Unverified
Multi-Stream Perturbation Attack: Breaking Safety Alignment of Thinking LLMs Through Concurrent Task Interference	Mar 10, 2026	—Unverified
Code-Space Response Oracles: Generating Interpretable Multi-Agent Policies with Large Language Models	Mar 10, 2026	—Unverified
Lost in the Middle at Birth: An Exact Theory of Transformer Position Bias	Mar 10, 2026	—Unverified
A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method	Mar 10, 2026	—Unverified
4DEquine: Disentangling Motion and Appearance for 4D Equine Reconstruction from Monocular Video	Mar 10, 2026	—Unverified
AR-VLA: True Autoregressive Action Expert for Vision-Language-Action Models	Mar 10, 2026	—Unverified
The Prediction-Measurement Gap: Toward Meaning Representations as Scientific Instruments	Mar 10, 2026	—Unverified
Reason and Verify: A Framework for Faithful Retrieval-Augmented Generation	Mar 10, 2026	—Unverified
ReMix: Reinforcement routing for mixtures of LoRAs in LLM finetuning	Mar 10, 2026	—Unverified
Compatibility at a Cost: Systematic Discovery and Exploitation of MCP Clause-Compliance Vulnerabilities	Mar 10, 2026	—Unverified
Stability and Robustness via Regularization: Bandit Inference via Regularized Stochastic Mirror Descent	Mar 10, 2026	—Unverified
Flexible Cutoff Learning: Optimizing Machine Learning Potentials After Training	Mar 10, 2026	—Unverified
ARCHE: Autoregressive Residual Compression with Hyperprior and Excitation	Mar 10, 2026	—Unverified
MCP-in-SoS: Risk assessment framework for open-source MCP servers	Mar 10, 2026	—Unverified
Adaptive Activation Cancellation for Hallucination Mitigation in Large Language Models	Mar 10, 2026	—Unverified
Actor-Accelerated Policy Dual Averaging for Reinforcement Learning in Continuous Action Spaces	Mar 10, 2026	—Unverified
Taming Score-Based Denoisers in ADMM: A Convergent Plug-and-Play Framework	Mar 10, 2026	—Unverified
ViDia2Std: A Parallel Corpus and Methods for Low-Resource Vietnamese Dialect-to-Standard Translation	Mar 10, 2026	—Unverified
Sabiá-4 Technical Report	Mar 10, 2026	—Unverified
SDSR: A Spectral Divide-and-Conquer Approach for Species Tree Reconstruction	Mar 10, 2026	—Unverified
An Automated Radiomics Framework for Postoperative Survival Prediction in Colorectal Liver Metastases using Preoperative MRI	Mar 10, 2026	—Unverified
A Diffusion Analysis of Policy Gradient for Stochastic Bandits	Mar 10, 2026	—Unverified
Why Does It Look There? Structured Explanations for Image Classification	Mar 10, 2026	—Unverified
S-GRADES -- Studying Generalization of Student Response Assessments in Diverse Evaluative Settings	Mar 10, 2026	—Unverified
One Adapter for All: Towards Unified Representation in Step-Imbalanced Class-Incremental Learning	Mar 10, 2026	—Unverified
SiMPO: Measure Matching for Online Diffusion Reinforcement Learning	Mar 10, 2026	—Unverified
Joint Imaging-ROI Representation Learning via Cross-View Contrastive Alignment for Brain Disorder Classification	Mar 10, 2026	—Unverified
Improving TabPFN's Synthetic Data Generation by Integrating Causal Structure	Mar 10, 2026	—Unverified
A Robust Deep Learning Framework for Bangla License Plate Recognition Using YOLO and Vision-Language OCR	Mar 10, 2026	—Unverified
Robust Post-Training for Generative Recommenders: Why Exponential Reward-Weighted SFT Outperforms RLHF	Mar 10, 2026	—Unverified
GSVD for Geometry-Grounded Dataset Comparison: An Alignment Angle Is All You Need	Mar 10, 2026	—Unverified
VCR: Variance-Driven Channel Recalibration for Robust Low-Light Enhancement	Mar 10, 2026	—Unverified
From Phase Prediction to Phase Design: A ReAct Agent Framework for High-Entropy Alloy Discovery	Mar 10, 2026	—Unverified
CR-Bench: Evaluating the Real-World Utility of AI Code Review Agents	Mar 10, 2026	—Unverified
OA-NBV: Occlusion-Aware Next-Best-View Planning for Human-Centered Active Perception on Mobile Robots	Mar 10, 2026	—Unverified
Unifying Logical and Physical Layout Representations via Heterogeneous Graphs for Circuit Congestion Prediction	Mar 10, 2026	—Unverified
DIVE: Scaling Diversity in Agentic Task Synthesis for Generalizable Tool Use	Mar 10, 2026	—Unverified
Quality-Driven Agentic Reasoning for LLM-Assisted Software Design: Questions-of-Thoughts (QoT) as a Time-Series Self-QA Chain	Mar 10, 2026	—Unverified
The Confidence Gate Theorem: When Should Ranked Decision Systems Abstain?	Mar 10, 2026	—Unverified
CLEAR-Mamba:Towards Accurate, Adaptive and Trustworthy Multi-Sequence Ophthalmic Angiography Classification	Mar 10, 2026	CodeCode Available
Exploring Single Domain Generalization of LiDAR-based Semantic Segmentation under Imperfect Labels	Mar 10, 2026	—Unverified
M^2-Occ: Resilient 3D Semantic Occupancy Prediction for Autonomous Driving with Incomplete Camera Inputs	Mar 10, 2026	CodeCode Available
An Interpretable Operator-Learning Model for Electric Field Profile Reconstruction in Discharges Based on the EFISH Method	Mar 10, 2026	—Unverified
Enhancing Retrieval-Augmented Generation with Entity Linking for Educational Platforms	Mar 10, 2026	—Unverified
Hybrid Hidden Markov Model for Modeling Equity Excess Growth Rate Dynamics: A Discrete-State Approach with Jump-Diffusion	Mar 10, 2026	—Unverified