The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2301–2350 of 659983 papers

Title	Date	Status	Hype
SR-Nav: Spatial Relationships Matter for Zero-shot Object Goal Navigation	Mar 19, 2026	CodeCode Available	0
HAViT: Historical Attention Vision Transformer	Mar 19, 2026	CodeCode Available	0
MemMA: Coordinating the Memory Cycle through Multi-Agent Reasoning and In-Situ Self-Evolution	Mar 19, 2026	CodeCode Available	0
HORNet: Task-Guided Frame Selection for Video Question Answering with Vision-Language Models	Mar 19, 2026	CodeCode Available	0
DriftGuard: Mitigating Asynchronous Data Drift in Federated Learning	Mar 19, 2026	CodeCode Available	0
Multi-Modal Building Change Detection for Large-Scale Small Changes: Benchmark and Baseline	Mar 19, 2026	CodeCode Available	0
MIDST Challenge at SaTML 2025: Membership Inference over Diffusion-models-based Synthetic Tabular data	Mar 19, 2026	CodeCode Available	0
Generation Models Know Space: Unleashing Implicit 3D Priors for Scene Understanding	Mar 19, 2026	CodeCode Available	0
AndroTMem: From Interaction Trajectories to Anchored Memory in Long-Horizon GUI Agents	Mar 19, 2026	CodeCode Available	0
A Multicenter Benchmark of Multiple Instance Learning Models for Lymphoma Subtyping from HE-stained Whole Slide Images	Mar 19, 2026	CodeCode Available	0
Offline Materials Optimization with CliqueFlowmer	Mar 19, 2026	CodeCode Available	0
Towards Onboard Continuous Change Detection for Floods	Mar 19, 2026	CodeCode Available	0
Farther the Shift, Sparser the Representation: Analyzing OOD Mechanisms in LLMs	Mar 19, 2026	CodeCode Available	0
Cell-Type Prototype-Informed Neural Network for Gene Expression Estimation from Pathology Images	Mar 19, 2026	CodeCode Available	0
Translating MRI to PET through Conditional Diffusion Models with Enhanced Pathology Awareness	Mar 19, 2026	CodeCode Available	0
AJAR: Adaptive Jailbreak Architecture for Red-teaming	Mar 19, 2026	CodeCode Available	0
Cubic Discrete Diffusion: Discrete Visual Generation on High-Dimensional Representation Tokens	Mar 19, 2026	CodeCode Available	0
ELiC: Efficient LiDAR Geometry Compression via Cross-Bit-depth Feature Propagation and Bag-of-Encoders	Mar 19, 2026	CodeCode Available	0
MonoArt: Progressive Structural Reasoning for Monocular Articulated 3D Reconstruction	Mar 19, 2026	—Unverified	1
ProRL Agent: Rollout-as-a-Service for RL Training of Multi-Turn LLM Agents	Mar 19, 2026	—Unverified	1
EffectErase: Joint Video Object Removal and Insertion for High-Quality Effect Erasing	Mar 19, 2026	—Unverified	2
TerraScope: Pixel-Grounded Visual Reasoning for Earth Observation	Mar 19, 2026	—Unverified	2
Bridging Semantic and Kinematic Conditions with Diffusion-based Discrete Motion Tokenizer	Mar 19, 2026	—Unverified	1
LiteReality: Graphics-Ready 3D Scene Reconstruction from RGB-D Scans	Mar 19, 2026	—Unverified	3
Infherno: End-to-end Agent-based FHIR Resource Synthesis from Free-form Clinical Notes	Mar 19, 2026	—Unverified	1
Matryoshka Gaussian Splatting	Mar 19, 2026	—Unverified	1
Safety is Non-Compositional: A Formal Framework for Capability-Based AI Systems	Mar 19, 2026	—Unverified	0
TrajBooster: Boosting Humanoid Whole-Body Manipulation via Trajectory-Centric Learning	Mar 19, 2026	—Unverified	2
From Far and Near: Perceptual Evaluation of Crowd Representations Across Levels of Detail	Mar 19, 2026	—Unverified	0
LuMamba: Latent Unified Mamba for Electrode Topology-Invariant and Efficient EEG Modeling	Mar 19, 2026	CodeCode Available	0
Full waveform inversion method based on diffusion model	Mar 18, 2026	—Unverified	0
CN-Buzz2Portfolio: A Chinese-Market Dataset and Benchmark for LLM-Based Macro and Sector Asset Allocation from Daily Trending Financial News	Mar 18, 2026	—Unverified	0
Memory Bear AI Memory Science Engine for Multimodal Affective Intelligence: A Technical Report	Mar 18, 2026	—Unverified	0
On the Fragility of AI Agent Collusion	Mar 18, 2026	—Unverified	0
STAC: Plug-and-Play Spatio-Temporal Aware Cache Compression for Streaming 3D Reconstruction	Mar 18, 2026	—Unverified	0
AgentComm-Bench: Stress-Testing Cooperative Embodied AI Under Latency, Packet Loss, and Bandwidth Collapse	Mar 18, 2026	—Unverified	0
Efficient Visual Anomaly Detection at the Edge: Enabling Real-Time Industrial Inspection on Resource-Constrained Devices	Mar 18, 2026	—Unverified	0
Remote Sensing Image Dehazing: A Systematic Review of Progress, Challenges, and Prospects	Mar 18, 2026	—Unverified	0
Transparent Fragments Contour Estimation via Visual-Tactile Fusion for Autonomous Reassembly	Mar 18, 2026	—Unverified	0
Grounded Multimodal Retrieval-Augmented Drafting of Radiology Impressions Using Case-Based Similarity Search	Mar 18, 2026	—Unverified	0
Mathematical Modeling of Cancer-Bacterial Therapy: Analysis and Numerical Simulation via Physics-Informed Neural Networks	Mar 18, 2026	—Unverified	0
Goedel-Code-Prover: Hierarchical Proof Search for Open State-of-the-Art Code Verification	Mar 18, 2026	—Unverified	0
PAI: Fast, Accurate, and Full Benchmark Performance Projection with AI	Mar 18, 2026	—Unverified	0
FalconBC: Flow matching for Amortized inference of Latent-CONditioned physiologic Boundary Conditions	Mar 18, 2026	—Unverified	0
DriveVLM-RL: Neuroscience-Inspired Reinforcement Learning with Vision-Language Models for Safe and Deployable Autonomous Driving	Mar 18, 2026	—Unverified	0
WORKSWORLD: A Domain for Integrated Numeric Planning and Scheduling of Distributed Pipelined Workflows	Mar 18, 2026	—Unverified	0
TeachingCoach: A Fine-Tuned Scaffolding Chatbot for Instructional Guidance to Instructors	Mar 18, 2026	—Unverified	0
How Psychological Learning Paradigms Shaped and Constrained Artificial Intelligence	Mar 18, 2026	—Unverified	0
Computation-Utility-Privacy Tradeoffs in Bayesian Estimation	Mar 18, 2026	—Unverified	0
Path-Constrained Mixture-of-Experts	Mar 18, 2026	—Unverified	0