The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8751–8800 of 661570 papers

Title	Date	Status	Hype
From Spatial to Actions: Grounding Vision-Language-Action Model in Spatial Foundation Priors	Mar 10, 2026	—Unverified	1
Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation	Mar 10, 2026	—Unverified	0
Cognitively Layered Data Synthesis for Domain Adaptation of LLMs to Space Situational Awareness	Mar 10, 2026	—Unverified	0
CTRL Your Shift: Clustered Transfer Residual Learning for Many Small Datasets	Mar 10, 2026	—Unverified	0
AI Meets Mathematics Education: A Case Study on Supporting an Instructor in a Large Mathematics Class with Context-Aware AI	Mar 9, 2026	—Unverified	0
AlpsBench: An LLM Personalization Benchmark for Real-Dialogue Memorization and Preference Alignment	Mar 9, 2026	—Unverified	0
Rheos: Modelling Continuous Motion Dynamics in Hierarchical 3D Scene Graphs	Mar 9, 2026	—Unverified	0
Joint Return and Risk Modeling with Deep Neural Networks for Portfolio Construction	Mar 9, 2026	—Unverified	0
Speculating Experts Accelerates Inference for Mixture-of-Experts	Mar 9, 2026	CodeCode Available	0
Neural Dynamics Self-Attention for Spiking Transformers	Mar 9, 2026	—Unverified	0
Towards Differentiating Between Failures and Domain Shifts in Industrial Data Streams	Mar 9, 2026	—Unverified	0
DynaTrust: Defending Multi-Agent Systems Against Sleeper Agents via Dynamic Trust Graphs	Mar 9, 2026	—Unverified	0
Disentangling Prompt Dependence to Evaluate Segmentation Reliability in Gynecological MRI	Mar 9, 2026	—Unverified	0
Patient-Level Multimodal Question Answering from Multi-Site Auscultation Recordings	Mar 9, 2026	—Unverified	0
From Refusal Tokens to Refusal Control: Discovering and Steering Category-Specific Refusal Directions	Mar 9, 2026	—Unverified	0
Graph2Video: Leveraging Video Models to Model Dynamic Graph Evolution	Mar 9, 2026	—Unverified	0
WaveComm: Lightweight Communication for Collaborative Perception via Wavelet Feature Distillation	Mar 9, 2026	—Unverified	0
Real-Time Monocular Scene Analysis for UAV in Outdoor Environments	Mar 9, 2026	—Unverified	0
Agentic LLM Workflow for MR Spectroscopy Volume-of-Interest Placements in Brain Tumors	Mar 9, 2026	—Unverified	0
The ARC of Progress towards AGI: A Living Survey of Abstraction and Reasoning	Mar 9, 2026	—Unverified	0
Bi-CamoDiffusion: A Boundary-informed Diffusion Approach for Camouflaged Object Detection	Mar 9, 2026	—Unverified	0
Learning When to Trust in Contextual Bandits	Mar 9, 2026	—Unverified	0
Int3DNet: Scene-Motion Cross Attention Network for 3D Intention Prediction in Mixed Reality	Mar 9, 2026	—Unverified	0
BrainCast: A Spatio-Temporal Forecasting Model for Whole-Brain fMRI Time Series Prediction	Mar 9, 2026	—Unverified	0
Multimodal Deep Learning for Dynamic and Static Neuroimaging: Integrating MRI and fMRI for Alzheimer Disease Analysis	Mar 9, 2026	—Unverified	0
IAML: Illumination-Aware Mirror Loss for Progressive Learning in Low-Light Image Enhancement Auto-encoders	Mar 9, 2026	—Unverified	0
GraphVLM: Benchmarking Vision Language Models for Multimodal Graph Learning	Mar 9, 2026	CodeCode Available	0
Thinking in Uncertainty: Mitigating Hallucinations in MLRMs with Latent Entropy-Aware Decoding	Mar 9, 2026	—Unverified	2
FineRMoE: Dimension Expansion for Finer-Grained Expert with Its Upcycling Approach	Mar 9, 2026	—Unverified	1
The Conundrum of Trustworthy Research on Attacking Personally Identifiable Information Removal Techniques	Mar 9, 2026	—Unverified	0
Quantization of Ricci Curvature in Information Geometry	Mar 9, 2026	—Unverified	0
ConFu: Contemplate the Future for Better Speculative Sampling	Mar 9, 2026	—Unverified	0
Revisiting Sharpness-Aware Minimization: A More Faithful and Effective Implementation	Mar 9, 2026	—Unverified	0
Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification	Mar 9, 2026	—Unverified	0
OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies	Mar 9, 2026	—Unverified	0
Training Language Models via Neural Cellular Automata	Mar 9, 2026	—Unverified	0
Tool Receipts, Not Zero-Knowledge Proofs: Practical Hallucination Detection for AI Agents	Mar 9, 2026	—Unverified	0
Multi-Agent Memory from a Computer Architecture Perspective: Visions and Challenges Ahead	Mar 9, 2026	—Unverified	0
SBOMs into Agentic AIBOMs: Schema Extensions, Agentic Orchestration, and Reproducibility Evaluation	Mar 9, 2026	—Unverified	0
Hybrid Quantum-Classical Encoding for Accurate Residue-Level pKa Prediction	Mar 9, 2026	—Unverified	0
Cluster-Aware Attention-Based Deep Reinforcement Learning for Pickup and Delivery Problems	Mar 9, 2026	—Unverified	0
InFusionLayer: a CFA-based ensemble tool to generate new classifiers for learning and modeling	Mar 9, 2026	CodeCode Available	0
DualTurn: Learning Turn-Taking from Dual-Channel Generative Speech Pretraining	Mar 9, 2026	—Unverified	0
One Model Is Enough: Native Retrieval Embeddings from LLM Agent Hidden States	Mar 9, 2026	—Unverified	0
PSTNet: Physically-Structured Turbulence Network	Mar 9, 2026	—Unverified	0
Slumbering to Precision: Enhancing Artificial Neural Network Calibration Through Sleep-like Processes	Mar 9, 2026	—Unverified	0
DyLLM: Efficient Diffusion LLM Inference via Saliency-based Token Selection and Partial Attention	Mar 9, 2026	—Unverified	0
Wasserstein Gradient Flows for Scalable and Regularized Barycenter Computation	Mar 9, 2026	—Unverified	0
Thickening-to-Thinning: Reward Shaping via Human-Inspired Learning Dynamics for LLM Reasoning	Mar 9, 2026	—Unverified	0
Hinge Regression Tree: A Newton Method for Oblique Regression Tree Splitting	Mar 9, 2026	—Unverified	0