The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2101–2150 of 659983 papers

Title	Date	Status	Hype
Learning to Predict, Discover, and Reason in High-Dimensional Event Sequences	Mar 19, 2026	—Unverified	0
SCALE:Scalable Conditional Atlas-Level Endpoint transport for virtual cell perturbation prediction	Mar 19, 2026	—Unverified	0
SAMA: Factorized Semantic Anchoring and Motion Alignment for Instruction-Guided Video Editing	Mar 19, 2026	—Unverified	1
Enhancing the Parameterization of Reservoir Properties for Data Assimilation Using Deep VAE-GAN	Mar 19, 2026	—Unverified	0
Cross-Lingual LLM-Judge Transfer via Evaluation Decomposition	Mar 19, 2026	—Unverified	0
Balanced Thinking: Improving Chain of Thought Training in Vision Language Models	Mar 19, 2026	—Unverified	0
Ontology-Guided Diffusion for Zero-Shot Visual Sim2Real Transfer	Mar 19, 2026	—Unverified	0
Measuring 3D Spatial Geometric Consistency in Dynamic Generated Videos	Mar 19, 2026	—Unverified	0
RADIUS: Ranking, Distribution, and Significance - A Comprehensive Alignment Suite for Survey Simulation	Mar 19, 2026	—Unverified	0
Robustness, Cost, and Attack-Surface Concentration in Phishing Detection	Mar 19, 2026	—Unverified	0
LVOmniBench: Pioneering Long Audio-Video Understanding Evaluation for Omnimodal LLMs	Mar 19, 2026	—Unverified	1
A Model Ensemble-Based Post-Processing Framework for Fairness-Aware Prediction	Mar 19, 2026	—Unverified	0
A Comparative Empirical Study of Catastrophic Forgetting Mitigation in Sequential Task Adaptation for Continual Natural Language Processing Systems	Mar 19, 2026	—Unverified	0
Multiscale Switch for Semi-Supervised and Contrastive Learning in Medical Ultrasound Image Segmentation	Mar 19, 2026	CodeCode Available	0
Unmasking Algorithmic Bias in Predictive Policing: A GAN-Based Simulation Framework with Multi-City Temporal Analysis	Mar 19, 2026	—Unverified	0
AlignMamba-2: Enhancing Multimodal Fusion and Sentiment Analysis with Modality-Aware Mamba	Mar 19, 2026	—Unverified	0
CoDA: Exploring Chain-of-Distribution Attacks and Post-Hoc Token-Space Repair for Medical Vision-Language Models	Mar 19, 2026	—Unverified	0
Model Order Reduction of Cerebrovascular Hemodynamics Using POD_Galerkin and Reservoir Computing_based Approach	Mar 19, 2026	—Unverified	0
Beyond Passive Aggregation: Active Auditing and Topology-Aware Defense in Decentralized Federated Learning	Mar 19, 2026	—Unverified	0
Single Agent Robust Deep Reinforcement Learning for Bus Fleet Control	Mar 19, 2026	—Unverified	0
Transfer Learning for Neutrino Scattering: Domain Adaptation with GANs	Mar 19, 2026	—Unverified	0
Multi-Preconditioned LBFGS for Training Finite-Basis PINNs	Mar 19, 2026	—Unverified	0
Foundations and Architectures of Artificial Intelligence for Motor Insurance	Mar 19, 2026	—Unverified	0
SRRM: Improving Recursive Transport Surrogates in the Small-Discrepancy Regime	Mar 19, 2026	—Unverified	0
Measuring and Exploiting Confirmation Bias in LLM-Assisted Security Code Review	Mar 19, 2026	—Unverified	0
Teleological Inference in Structural Causal Models via Intentional Interventions	Mar 19, 2026	—Unverified	0
Zipper-LoRA: Dynamic Parameter Decoupling for Speech-LLM based Multilingual Speech Recognition	Mar 19, 2026	CodeCode Available	0
Evaluating Model-Free Policy Optimization in Masked-Action Environments via an Exact Blackjack Oracle	Mar 19, 2026	—Unverified	0
Deep Expert Injection for Anchoring Retinal VLMs with Domain-Specific Knowledge	Mar 19, 2026	—Unverified	0
HaltNav: Reactive Visual Halting over Lightweight Topological Priors for Robust Vision-Language Navigation	Mar 19, 2026	—Unverified	0
Evaluating Counterfactual Strategic Reasoning in Large Language Models	Mar 19, 2026	—Unverified	0
AIMER: Calibration-Free Task-Agnostic MoE Pruning	Mar 19, 2026	—Unverified	0
Remove360: Benchmarking Residuals After Object Removal in 3D Gaussian Splatting	Mar 19, 2026	—Unverified	0
LLM-Augmented Changepoint Detection: A Framework for Ensemble Detection and Automated Explanation	Mar 19, 2026	—Unverified	0
BVSIMC: Bayesian Variable Selection-Guided Inductive Matrix Completion for Improved and Interpretable Drug Discovery	Mar 19, 2026	—Unverified	0
HypeMed: Enhancing Medication Recommendations with Hypergraph-Based Patient Relationships	Mar 19, 2026	—Unverified	0
Interpretable Prostate Cancer Detection using a Small Cohort of MRI Images	Mar 19, 2026	—Unverified	0
NeuroGame Transformer: Gibbs-Inspired Attention Driven by Game Theory and Statistical Physics	Mar 19, 2026	CodeCode Available	0
Implicit Grading Bias in Large Language Models: How Writing Style Affects Automated Assessment Across Math, Programming, and Essay Tasks	Mar 19, 2026	—Unverified	0
Progressive Training for Explainable Citation-Grounded Dialogue: Reducing Hallucination to Zero in English-Hindi LLMs	Mar 19, 2026	—Unverified	0
DaPT: A Dual-Path Framework for Multilingual Multi-hop Question Answering	Mar 19, 2026	—Unverified	0
GSMem: 3D Gaussian Splatting as Persistent Spatial Memory for Zero-Shot Embodied Exploration and Reasoning	Mar 19, 2026	—Unverified	0
Meanings and Measurements: Multi-Agent Probabilistic Grounding for Vision-Language Navigation	Mar 19, 2026	—Unverified	0
OS-Themis: A Scalable Critic Framework for Generalist GUI Rewards	Mar 19, 2026	—Unverified	0
Evaluating Game Difficulty in Tetris Block Puzzle	Mar 19, 2026	—Unverified	0
On Optimizing Multimodal Jailbreaks for Spoken Language Models	Mar 19, 2026	—Unverified	0
Words at Play: Benchmarking Audio Pun Understanding in Large Audio-Language Models	Mar 19, 2026	—Unverified	0
DSPO: Stable and Efficient Policy Optimization for Agentic Search and Reasoning	Mar 19, 2026	—Unverified	0
DriveSplat: Unified Neural Gaussian Reconstruction for Dynamic Driving Scenes	Mar 19, 2026	—Unverified	0
A Unified Generalization Framework for Model Merging: Trade-offs, Non-Linearity, and Scaling Laws	Mar 19, 2026	—Unverified	0