The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3551–3600 of 659983 papers

Title	Date	Status
Language as a Wave Phenomenon: Semantic Phase Locking and Interference in Neural Networks	Mar 17, 2026	—Unverified
Fusion Complexity Inversion: Why Simpler Cross View Modules Outperform SSMs and Cross View Attention Transformers for Pasture Biomass Regression	Mar 17, 2026	—Unverified
Amnesia: Adversarial Semantic Layer Specific Activation Steering in Large Language Models	Mar 17, 2026	—Unverified
DUCTILE: Agentic LLM Orchestration of Engineering Analysis in Product Development Practice	Mar 17, 2026	—Unverified
Enhanced Atrial Fibrillation Prediction in ESUS Patients with Hypergraph-based Pre-training	Mar 17, 2026	—Unverified
Lipschitz-Based Robustness Certification Under Floating-Point Execution	Mar 17, 2026	—Unverified
WorldVLM: Combining World Model Forecasting and Vision-Language Reasoning	Mar 17, 2026	—Unverified
Residual Stream Duality in Modern Transformer Architectures	Mar 17, 2026	—Unverified
Shuffling the Stochastic Mirror Descent via Dual Lipschitz Continuity and Kernel Conditioning	Mar 17, 2026	—Unverified
A Depth-Aware Comparative Study of Euclidean and Hyperbolic Graph Neural Networks on Bitcoin Transaction Systems	Mar 17, 2026	—Unverified
Efficient LLM Serving for Agentic Workflows: A Data Systems Perspective	Mar 17, 2026	—Unverified
Human/AI Collective Intelligence for Deliberative Democracy: A Human-Centred Design Approach	Mar 17, 2026	—Unverified
STARK: Spatio-Temporal Attention for Representation of Keypoints for Continuous Sign Language Recognition	Mar 17, 2026	—Unverified
Language Models Don't Know What You Want: Evaluating Personalization in Deep Research Needs Real Users	Mar 17, 2026	—Unverified
Pre-training LLM without Learning Rate Decay Enhances Supervised Fine-Tuning	Mar 17, 2026	—Unverified
EFF-Grasp: Energy-Field Flow Matching for Physics-Aware Dexterous Grasp Generation	Mar 17, 2026	—Unverified
HIPO: Instruction Hierarchy via Constrained Reinforcement Learning	Mar 17, 2026	—Unverified
Homogeneous and Heterogeneous Consistency progressive Re-ranking for Visible-Infrared Person Re-identification	Mar 17, 2026	—Unverified
Polyglot-Lion: Efficient Multilingual ASR for Singapore via Balanced Fine-Tuning of Qwen3-ASR	Mar 17, 2026	—Unverified
Online Semi-infinite Linear Programming: Efficient Algorithms via Function Approximation	Mar 17, 2026	—Unverified
MOSAIC: Composable Safety Alignment with Modular Control Tokens	Mar 17, 2026	—Unverified
How to Utilize Complementary Vision-Text Information for 2D Structure Understanding	Mar 17, 2026	—Unverified
Physics-integrated neural differentiable modeling for immersed boundary systems	Mar 17, 2026	—Unverified
FG-SGL: Fine-Grained Semantic Guidance Learning via Motion Process Decomposition for Micro-Gesture Recognition	Mar 17, 2026	—Unverified
Behavioral Steering in a 35B MoE Language Model via SAE-Decoded Probe Vectors: One Agency Axis, Not Five Traits	Mar 17, 2026	—Unverified
Overview of the CXR-LT 2026 Challenge: Multi-Center Long-Tailed and Zero Shot Chest X-ray Classification	Mar 17, 2026	—Unverified
On-Policy Self-Distillation for Reasoning Compression	Mar 17, 2026	CodeCode Available
Clinical Priors Guided Lung Disease Detection in 3D CT Scans	Mar 17, 2026	—Unverified
Controllable Graph Generation with Diffusion Models via Inference-Time Tree Search Guidance	Mar 17, 2026	—Unverified
Proactive Rejection and Grounded Execution: A Dual-Stage Intent Analysis Paradigm for Safe and Efficient AIoT Smart Homes	Mar 17, 2026	—Unverified
Muon Converges under Heavy-Tailed Noise: Nonconvex Hölder-Smooth Empirical Risk Minimization	Mar 17, 2026	—Unverified
Large Reward Models: Generalizable Online Robot Reward Generation with Vision-Language Models	Mar 17, 2026	—Unverified
Foundation-Model Surrogates Enable Data-Efficient Active Learning for Materials Discovery	Mar 17, 2026	—Unverified
Alternating Gradient Flow Utility: A Unified Metric for Structural Pruning and Dynamic Routing in Deep Networks	Mar 17, 2026	—Unverified
Content-Aware Mamba for Learned Image Compression	Mar 17, 2026	CodeCode Available
SARMAE: Masked Autoencoder for SAR Representation Learning	Mar 17, 2026	CodeCode Available
Urban Socio-Semantic Segmentation with Vision-Language Reasoning	Mar 17, 2026	CodeCode Available
Power Analysis for Prediction-Powered Inference	Mar 17, 2026	CodeCode Available
SciZoom: A Large-scale Benchmark for Hierarchical Scientific Summarization across the LLM Era	Mar 17, 2026	CodeCode Available
PureCLIP-Depth: Prompt-Free and Decoder-Free Monocular Depth Estimation within CLIP Embedding Space	Mar 17, 2026	CodeCode Available
Point-to-Mask: From Arbitrary Point Annotations to Mask-Level Infrared Small Target Detection	Mar 17, 2026	CodeCode Available
AW-MoE: All-Weather Mixture of Experts for Robust Multi-Modal 3D Object Detection	Mar 17, 2026	CodeCode Available
MSGNav: Unleashing the Power of Multi-modal 3D Scene Graph for Zero-Shot Embodied Navigation	Mar 17, 2026	CodeCode Available
3M-TI: High-Quality Mobile Thermal Imaging via Calibration-free Multi-Camera Cross-Modal Diffusion	Mar 17, 2026	CodeCode Available
KEEP: A KV-Cache-Centric Memory Management System for Efficient Embodied Planning	Mar 17, 2026	CodeCode Available
ReFORM: Review-aggregated Profile Generation via LLM with Multi-Factor Attention for Restaurant Recommendation	Mar 17, 2026	CodeCode Available
ERGO: Efficient High-Resolution Visual Understanding for Vision-Language Models	Mar 17, 2026	CodeCode Available
AGRAG: Advanced Graph-based Retrieval-Augmented Generation for LLMs	Mar 17, 2026	CodeCode Available
MemPO: Self-Memory Policy Optimization for Long-Horizon Agents	Mar 17, 2026	CodeCode Available
Integrating Weather Foundation Model and Satellite to Enable Fine-Grained Solar Irradiance Forecasting	Mar 17, 2026	CodeCode Available