The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2401–2450 of 659983 papers

Title	Date	Status
How LLMs Distort Our Written Language	Mar 18, 2026	—Unverified
Efficient Dense Crowd Trajectory Prediction Via Dynamic Clustering	Mar 18, 2026	—Unverified
Enactor: From Traffic Simulators to Surrogate World Models	Mar 18, 2026	—Unverified
Modeling the human lexicon under temperature variations: linguistic factors, diversity and typicality in LLM word associations	Mar 18, 2026	—Unverified
Conflict-Free Policy Languages for Probabilistic ML Predicates: A Framework and Case Study with the Semantic Router DSL	Mar 18, 2026	—Unverified
Starting Off on the Wrong Foot: Pitfalls in Data Preparation	Mar 18, 2026	—Unverified
MicroVision: An Open Dataset and Benchmark Models for Detecting Vulnerable Road Users and Micromobility Vehicles	Mar 18, 2026	—Unverified
Tackling the Sign Problem in the Doped Hubbard Model with Normalizing Flows	Mar 18, 2026	—Unverified
Semantic Segmentation and Depth Estimation for Real-Time Lunar Surface Mapping Using 3D Gaussian Splatting	Mar 18, 2026	—Unverified
A Hybrid Conditional Diffusion-DeepONet Framework for High-Fidelity Stress Prediction in Hyperelastic Materials	Mar 18, 2026	—Unverified
Toward Reliable, Safe, and Secure LLMs for Scientific Applications	Mar 18, 2026	—Unverified
Gradient-Informed Temporal Sampling Improves Rollout Accuracy in PDE Surrogate Training	Mar 18, 2026	—Unverified
EDM-ARS: A Domain-Specific Multi-Agent System for Automated Educational Data Mining Research	Mar 18, 2026	—Unverified
Detection Is Cheap, Routing Is Learned: Why Refusal-Based Alignment Evaluation Fails	Mar 18, 2026	—Unverified
CycleCap: Improving VLMs Captioning Performance via Self-Supervised Cycle Consistency Fine-Tuning	Mar 18, 2026	—Unverified
Offload or Overload: A Platform Measurement Study of Mobile Robotic Manipulation Workloads	Mar 18, 2026	—Unverified
The Validity Gap in Health AI Evaluation: A Cross-Sectional Analysis of Benchmark Composition	Mar 18, 2026	—Unverified
Sparse3DTrack: Monocular 3D Object Tracking Using Sparse Supervision	Mar 18, 2026	—Unverified
Fast and Generalizable NeRF Architecture Selection for Satellite Scene Reconstruction	Mar 18, 2026	—Unverified
Unrolled Reconstruction with Integrated Super-Resolution for Accelerated 3D LGE MRI	Mar 18, 2026	—Unverified
Learning to Reason with Curriculum I: Provable Benefits of Autocurriculum	Mar 18, 2026	—Unverified
Escaping Offline Pessimism: Vector-Field Reward Shaping for Safe Frontier Exploration	Mar 18, 2026	—Unverified
Consumer-to-Clinical Language Shifts in Ambient AI Draft Notes and Clinician-Finalized Documentation: A Multi-level Analysis	Mar 18, 2026	—Unverified
A Family of Adaptive Activation Functions for Mitigating Failure Modes in Physics-Informed Neural Networks	Mar 18, 2026	—Unverified
FaithSteer-BENCH: A Deployment-Aligned Stress-Testing Benchmark for Inference-Time Steering	Mar 18, 2026	—Unverified
MemArchitect: A Policy Driven Memory Governance Layer	Mar 18, 2026	—Unverified
VISTA: Validation-Guided Integration of Spatial and Temporal Foundation Models with Anatomical Decoding for Rare-Pathology VCE Event Detection	Mar 18, 2026	—Unverified
Understanding the Theoretical Foundations of Deep Neural Networks through Differential Equations	Mar 18, 2026	—Unverified
Can LLMs Reason Like Automated Theorem Provers for Rust Verification? VCoT-Bench: Evaluating via Verification Chain of Thought	Mar 18, 2026	—Unverified
Shifting Uncertainty to Critical Moments: Towards Reliable Uncertainty Quantification for VLA Model	Mar 18, 2026	—Unverified
HRI-SA: A Multimodal Dataset for Online Assessment of Human Situational Awareness during Remote Human-Robot Teaming	Mar 18, 2026	—Unverified
Epistemic Generative Adversarial Networks	Mar 18, 2026	—Unverified
Large-Scale Analysis of Political Propaganda on Moltbook	Mar 18, 2026	—Unverified
From Noise to Signal: When Outliers Seed New Topics	Mar 18, 2026	—Unverified
Final Report for the Workshop on Robotics & AI in Medicine	Mar 18, 2026	—Unverified
From Binary to Bilingual: How the National Weather Service is Using Artificial Intelligence to Develop a Comprehensive Translation Program	Mar 18, 2026	—Unverified
CytoSyn: a Foundation Diffusion Model for Histopathology -- Tech Report	Mar 18, 2026	—Unverified
AGRI-Fidelity: Evaluating the Reliability of Listenable Explanations for Poultry Disease Detection	Mar 18, 2026	—Unverified
Privacy-Preserving Machine Learning for IoT: A Cross-Paradigm Survey and Future Roadmap	Mar 18, 2026	—Unverified
LICA: Layered Image Composition Annotations for Graphic Design Research	Mar 18, 2026	—Unverified
DarkDriving: A Real-World Day and Night Aligned Dataset for Autonomous Driving in the Dark Environment	Mar 18, 2026	—Unverified
Transfer Learning for Contextual Joint Assortment-Pricing under Cross-Market Heterogeneity	Mar 18, 2026	—Unverified
Intellectual Stewardship: Re-adapting Human Minds for Creative Knowledge Work in the Age of AI	Mar 18, 2026	—Unverified
LGESynthNet: Controlled Scar Synthesis for Improved Scar Segmentation in Cardiac LGE-MRI Imaging	Mar 18, 2026	—Unverified
Universal Skeleton Understanding via Differentiable Rendering and MLLMs	Mar 18, 2026	—Unverified
A Structured Nonparametric Framework for Nonlinear Accelerated Failure Time Models (KAN-AFT)	Mar 18, 2026	—Unverified
Constrained Hybrid Metaheuristic: A Universal Framework for Continuous Optimisation	Mar 18, 2026	—Unverified
Rule-Based Explanations for Retrieval-Augmented LLM Systems	Mar 18, 2026	—Unverified
LLM-Augmented Computational Phenotyping of Long Covid	Mar 18, 2026	—Unverified
Multi-Trait Subspace Steering to Reveal the Dark Side of Human-AI Interaction	Mar 18, 2026	—Unverified