The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1401–1450 of 659983 papers

Title	Date	Status
Thermal is Always Wild: Characterizing and Addressing Challenges in Thermal-Only Novel View Synthesis	Mar 20, 2026	—Unverified
Solver-Aided Verification of Policy Compliance in Tool-Augmented LLM Agents	Mar 20, 2026	—Unverified
Policies Permitting LLM Use for Polishing Peer Reviews Are Currently Not Enforceable	Mar 20, 2026	—Unverified
SDE-Driven Spatio-Temporal Hypergraph Neural Networks for Irregular Longitudinal fMRI Connectome Modeling in Alzheimer's Disease	Mar 20, 2026	—Unverified
Reinforcement Learning from Multi-Source Imperfect Preferences: Best-of-Both-Regimes Regret	Mar 20, 2026	—Unverified
From Data to Laws: Neural Discovery of Conservation Laws Without False Positives	Mar 20, 2026	—Unverified
CREG: Compass Relational Evidence for Interpreting Spatial Reasoning in Vision-Language Models	Mar 20, 2026	—Unverified
Profiling learners' affective engagement: Emotion AI, intercultural pragmatics, and language learning	Mar 20, 2026	—Unverified
Spatio-Temporal Grid Intelligence: A Hybrid Graph Neural Network and LSTM Framework for Robust Electricity Theft Detection	Mar 20, 2026	—Unverified
AE-LLM: Adaptive Efficiency Optimization for Large Language Models	Mar 20, 2026	—Unverified
PARHAF, a human-authored corpus of clinical reports for fictitious patients in French	Mar 20, 2026	—Unverified
Meeting in the Middle: A Co-Design Paradigm for FHE and AI Inference	Mar 20, 2026	—Unverified
CogFormer: Learn All Your Models Once	Mar 20, 2026	—Unverified
Delightful Distributed Policy Gradient	Mar 20, 2026	—Unverified
Does This Gradient Spark Joy?	Mar 20, 2026	—Unverified
RMNP: Row-Momentum Normalized Preconditioning for Scalable Matrix-Based Optimization	Mar 20, 2026	—Unverified
Memory Over Maps: 3D Object Localization Without Reconstruction	Mar 20, 2026	—Unverified
Epistemic Observability in Language Models	Mar 20, 2026	—Unverified
When Negation Is a Geometry Problem in Vision-Language Models	Mar 20, 2026	—Unverified
Permutation-Consensus Listwise Judging for Robust Factuality Evaluation	Mar 20, 2026	—Unverified
ReBOL: Retrieval via Bayesian Optimization with Batched LLM Relevance Observations and Query Reformulation	Mar 20, 2026	—Unverified
Evaluating Large Language Models on Historical Health Crisis Knowledge in Resource-Limited Settings: A Hybrid Multi-Metric Study	Mar 20, 2026	—Unverified
Shift-Invariant Feature Attribution in the Application of Wireless Electrocardiograms	Mar 20, 2026	—Unverified
Diffutron: A Masked Diffusion Language Model for Turkish Language	Mar 20, 2026	—Unverified
Goal-oriented learning of stochastic dynamical systems using error bounds on path-space observables	Mar 20, 2026	—Unverified
DiffGraph: An Automated Agent-driven Model Merging Framework for In-the-Wild Text-to-Image Generation	Mar 20, 2026	—Unverified
End-to-End Optimization of Polarimetric Measurement and Material Classifier	Mar 20, 2026	—Unverified
Efficient Counterfactual Reasoning in ProbLog via Single World Intervention Programs	Mar 20, 2026	—Unverified
Distributed Gradient Clustering: Convergence and the Effect of Initialization	Mar 20, 2026	—Unverified
Measuring Reasoning Trace Legibility: Can Those Who Understand Teach?	Mar 20, 2026	—Unverified
Lessons and Open Questions from a Unified Study of Camera-Trap Species Recognition Over Time	Mar 20, 2026	—Unverified
Grounded Chess Reasoning in Language Models via Master Distillation	Mar 20, 2026	—Unverified
Revenue-Sharing as Infrastructure: A Distributed Business Model for Generative AI Platforms	Mar 20, 2026	—Unverified
Towards Practical Multimodal Hospital Outbreak Detection	Mar 20, 2026	—Unverified
LLM-Driven Heuristic Synthesis for Industrial Process Control: Lessons from Hot Steel Rolling	Mar 20, 2026	—Unverified
Understanding Behavior Cloning with Action Quantization	Mar 20, 2026	—Unverified
Benchmarking Efficient & Effective Camera Pose Estimation Strategies for Novel View Synthesis	Mar 20, 2026	—Unverified
Forward and inverse problems for measure flows in Bayes Hilbert spaces	Mar 20, 2026	—Unverified
Bounded Coupled AI Learning Dynamics in Tri-Hierarchical Drone Swarms	Mar 20, 2026	—Unverified
Procedural Refinement by LLM-driven Algorithmic Debugging for ARC-AGI-2	Mar 20, 2026	—Unverified
Hybrid Autoencoder-Isolation Forest approach for time series anomaly detection in C70XP cyclotron operation data at ARRONAX	Mar 20, 2026	—Unverified
ContractSkill: Repairable Contract-Based Skills for Multimodal Web Agents	Mar 20, 2026	—Unverified
Interpretable Multiple Myeloma Prognosis with Observational Medical Outcomes Partnership Data	Mar 20, 2026	—Unverified
The production of meaning in the processing of natural language	Mar 20, 2026	—Unverified
Uni-Classifier: Leveraging Video Diffusion Priors for Universal Guidance Classifier	Mar 20, 2026	—Unverified
Multi-Stage Fine-Tuning of Pathology Foundation Models with Head-Diverse Ensembling for White Blood Cell Classification	Mar 20, 2026	—Unverified
Jigsaw Regularization in Whole-Slide Image Classification	Mar 20, 2026	—Unverified
From Cross-Validation to SURE: Asymptotic Risk of Tuned Regularized Estimators	Mar 20, 2026	—Unverified
A chemical language model for reticular materials design	Mar 20, 2026	—Unverified
CAMA: Exploring Collusive Adversarial Attacks in c-MARL	Mar 20, 2026	—Unverified