The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11651–11700 of 661570 papers

Title	Date	Status	Hype
MAD-SmaAt-GNet: A Multimodal Advection-Guided Neural Network for Precipitation Nowcasting	Mar 3, 2026	—Unverified	0
Capability Thresholds and Manufacturing Topology: How Embodied Intelligence Triggers Phase Transitions in Economic Geography	Mar 3, 2026	—Unverified	0
VSPrefill: Vertical-Slash Sparse Attention with Lightweight Indexing for Long-Context Prefilling	Mar 3, 2026	—Unverified	0
Understanding the Dynamics of Demonstration Conflict in In-Context Learning	Mar 3, 2026	—Unverified	0
Act-Observe-Rewrite: Multimodal Coding Agents as In-Context Policy Learners for Robot Manipulation	Mar 3, 2026	—Unverified	0
Learning Unified Distance Metric for Heterogeneous Attribute Data Clustering	Mar 3, 2026	—Unverified	0
mHC-HSI: Clustering-Guided Hyper-Connection Mamba for Hyperspectral Image Classification	Mar 3, 2026	CodeCode Available	0
ACE-Brain-0: Spatial Intelligence as a Shared Scaffold for Universal Embodiments	Mar 3, 2026	—Unverified	0
MLV-Edit: Towards Consistent and Highly Efficient Editing for Minute-Level Videos	Mar 3, 2026	—Unverified	0
Higher Gauge Flow Models	Mar 3, 2026	—Unverified	0
Wasserstein Proximal Policy Gradient	Mar 3, 2026	—Unverified	0
Data-Driven Conditional Flexibility Index	Mar 3, 2026	—Unverified	0
Value Gradient Guidance for Flow Matching Alignment	Mar 3, 2026	—Unverified	0
MedXIAOHE: A Comprehensive Recipe for Building Medical MLLMs	Mar 3, 2026	—Unverified	0
Spilled Energy in Large Language Models	Mar 3, 2026	CodeCode Available	0
Demystifying Group Relative Policy Optimization: Its Policy Gradient is a U-Statistic	Mar 3, 2026	—Unverified	0
Design Generative AI for Practitioners: Exploring Interaction Approaches Aligned with Creative Practice	Mar 3, 2026	—Unverified	0
From Heuristic Selection to Automated Algorithm Design: LLMs Benefit from Strong Priors	Mar 3, 2026	—Unverified	0
Belief-Sim: Towards Belief-Driven Simulation of Demographic Misinformation Susceptibility	Mar 3, 2026	—Unverified	0
Seeing Clearly without Training: Mitigating Hallucinations in Multimodal LLMs for Remote Sensing	Mar 3, 2026	CodeCode Available	0
Gauge Flow Models	Mar 3, 2026	—Unverified	0
Towards a more realistic evaluation of machine learning models for bearing fault diagnosis	Mar 3, 2026	—Unverified	0
AgentAssay: Token-Efficient Regression Testing for Non-Deterministic AI Agent Workflows	Mar 3, 2026	—Unverified	0
Heterogeneous Agent Collaborative Reinforcement Learning	Mar 3, 2026	—Unverified	0
Combinatorial Sparse PCA Beyond the Spiked Identity Model	Mar 3, 2026	—Unverified	0
CoDAR: Continuous Diffusion Language Models are More Powerful Than You Think	Mar 3, 2026	—Unverified	0
On Discriminative vs. Generative classifiers: Rethinking MLLMs for Action Understanding	Mar 3, 2026	—Unverified	0
SemGS: Feed-Forward Semantic 3D Gaussian Splatting from Sparse Views for Generalizable Scene Understanding	Mar 3, 2026	—Unverified	0
Give me scissors: Collision-Free Dual-Arm Surgical Assistive Robot for Instrument Delivery	Mar 3, 2026	—Unverified	0
Real-Time Generative Policy via Langevin-Guided Flow Matching for Autonomous Driving	Mar 3, 2026	—Unverified	0
Minimal Computational Preconditions for Subjective Perspective in Artificial Agents	Mar 3, 2026	—Unverified	0
ForestPersons: A Large-Scale Dataset for Under-Canopy Missing Person Detection	Mar 3, 2026	—Unverified	0
Robust Heterogeneous Analog-Digital Computing for Mixture-of-Experts Models with Theoretical Generalization Guarantees	Mar 3, 2026	—Unverified	0
Detecting Structural Heart Disease from Electrocardiograms via a Generalized Additive Model of Interpretable Foundation-Model Predictors	Mar 3, 2026	—Unverified	0
Direct Reward Fine-Tuning on Poses for Single Image to 3D Human in the Wild	Mar 3, 2026	—Unverified	0
Contextualized Privacy Defense for LLM Agents	Mar 3, 2026	—Unverified	0
Any Resolution Any Geometry: From Multi-View To Multi-Patch	Mar 3, 2026	—Unverified	0
Interpreting Speaker Characteristics in the Dimensions of Self-Supervised Speech Features	Mar 3, 2026	—Unverified	0
TTT3R: 3D Reconstruction as Test-Time Training	Mar 3, 2026	—Unverified	4
CodecFlow: Efficient Bandwidth Extension via Conditional Flow Matching in Neural Codec Latent Space	Mar 3, 2026	—Unverified	0
Valet: A Standardized Testbed of Traditional Imperfect-Information Card Games	Mar 3, 2026	—Unverified	0
SOLAR: SVD-Optimized Lifelong Attention for Recommendation	Mar 3, 2026	—Unverified	0
EdgeFLow: Serverless Federated Learning via Sequential Model Migration in Edge Networks	Mar 3, 2026	—Unverified	0
FlashEvaluator: Expanding Search Space with Parallel Evaluation	Mar 3, 2026	—Unverified	0
Towards Parameter-Free Temporal Difference Learning	Mar 3, 2026	—Unverified	0
Agentic AI-based Coverage Closure for Formal Verification	Mar 3, 2026	—Unverified	0
Joint Optimization of Model Partitioning and Resource Allocation for Anti-Jamming Collaborative Inference Systems	Mar 3, 2026	—Unverified	0
Neural Electromagnetic Fields for High-Resolution Material Parameter Reconstruction	Mar 3, 2026	—Unverified	0
LiveAgentBench: Comprehensive Benchmarking of Agentic Systems Across 104 Real-World Challenges	Mar 3, 2026	—Unverified	0
OmniFashion: Towards Generalist Fashion Intelligence via Multi-Task Vision-Language Learning	Mar 3, 2026	—Unverified	0