The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9801–9850 of 661570 papers

Title	Date	Status
Self-Supervised Evolutionary Learning of Neurodynamic Progression and Identity Manifolds from EEG During Safety-Critical Decision Making	Mar 7, 2026	—Unverified
Training for Trustworthy Saliency Maps: Adversarial Training Meets Feature-Map Smoothing	Mar 7, 2026	—Unverified
VisualScratchpad: Inference-time Visual Concepts Analysis in Vision Language Models	Mar 7, 2026	—Unverified
Norm-Hierarchy Transitions in Representation Learning: When and Why Neural Networks Abandon Shortcuts	Mar 7, 2026	—Unverified
A Lightweight Digital-Twin-Based Framework for Edge-Assisted Vehicle Tracking and Collision Prediction	Mar 7, 2026	—Unverified
The Yerkes-Dodson Curve for AI Agents: Emergent Cooperation Under Environmental Pressure in Multi-Agent LLM Simulations	Mar 7, 2026	—Unverified
Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes	Mar 7, 2026	—Unverified
RILEC: Detection and Generation of L1 Russian Interference Errors in English Learner Texts	Mar 7, 2026	—Unverified
Position: LLMs Must Use Functor-Based and RAG-Driven Bias Mitigation for Fairness	Mar 7, 2026	—Unverified
Scheduling Parallel Optical Circuit Switches for AI Training	Mar 7, 2026	—Unverified
SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions	Mar 7, 2026	—Unverified
Video-EM: Event-Centric Episodic Memory for Long-Form Video Understanding	Mar 7, 2026	—Unverified
A Miniature Brain Transformer: Thalamic Gating, Hippocampal Lateralization, Amygdaloid Salience, and Prefrontal Working Memory in Attention-Coupled Latent Memory	Mar 7, 2026	—Unverified
See It, Say It, Sorted: An Iterative Training-Free Framework for Visually-Grounded Multimodal Reasoning in LVLMs	Mar 7, 2026	—Unverified
ScenePilot-Bench: A Large-Scale Dataset and Benchmark for Evaluation of Vision-Language Models in Autonomous Driving	Mar 7, 2026	—Unverified
Lap2: Revisiting Laplace DP-SGD for High Dimensions via Majorization Theory	Mar 7, 2026	—Unverified
Enhancing Web Agents with a Hierarchical Memory Tree	Mar 7, 2026	—Unverified
AdaGen: Learning Adaptive Policy for Image Synthesis	Mar 7, 2026	—Unverified
Efficient Vision Mamba for MRI Super-Resolution via Hybrid Selective Scanning	Mar 7, 2026	—Unverified
MrBERT: Modern Multilingual Encoders via Vocabulary, Domain, and Dimensional Adaptation	Mar 7, 2026	—Unverified
Tight Robustness Certification Through the Convex Hull of _0 Attacks	Mar 7, 2026	—Unverified
Efficient Algorithms for Logistic Contextual Slate Bandits with Bandit Feedback	Mar 7, 2026	—Unverified
PASS: Certified Subset Repair for Classical and Quantum Pairwise Constrained Clustering	Mar 7, 2026	—Unverified
Extended Empirical Validation of the Explainability Solution Space	Mar 7, 2026	—Unverified
Topology-Aware Reinforcement Learning over Graphs for Resilient Power Distribution Networks	Mar 7, 2026	—Unverified
Enhancing Consistency of Werewolf AI through Dialogue Summarization and Persona Information	Mar 7, 2026	—Unverified
Learning When to Cooperate Under Heterogeneous Goals	Mar 7, 2026	—Unverified
Shaping Parameter Contribution Patterns for Out-of-Distribution Detection	Mar 7, 2026	—Unverified
Taiwan Safety Benchmark and Breeze Guard: Toward Trustworthy AI for Taiwanese Mandarin	Mar 7, 2026	—Unverified
StructSAM: Structure- and Spectrum-Preserving Token Merging for Segment Anything Models	Mar 7, 2026	—Unverified
VINO: Video-driven Invariance for Non-contextual Objects via Structural Prior Guided De-contextualization	Mar 7, 2026	—Unverified
RAmmStein: Regime Adaptation in Mean-reverting Markets with Stein Thresholds -- Optimal Impulse Control in Concentrated AMMs	Mar 7, 2026	—Unverified
PrivMedChat: End-to-End Differentially Private RLHF for Medical Dialogue Systems	Mar 7, 2026	CodeCode Available
Do Modern Video-LLMs Need to Listen? A Benchmark Audit and Scalable Remedy	Mar 7, 2026	CodeCode Available
Efficient Diffusion-Based 3D Human Pose Estimation with Hierarchical Temporal Pruning	Mar 7, 2026	—Unverified
Unified Multi-Modal Interactive & Reactive 3D Motion Generation via Rectified Flow	Mar 7, 2026	—Unverified
ELHPlan: Efficient Long-Horizon Task Planning for Multi-Agent Collaboration	Mar 7, 2026	—Unverified
Toward a Physical Theory of Intelligence	Mar 7, 2026	—Unverified
Synthetic Augmentation in Imbalanced Learning: When It Helps, When It Hurts, and How Much to Add	Mar 7, 2026	—Unverified
CGL: Advancing Continual GUI Learning via Reinforcement Fine-Tuning	Mar 7, 2026	—Unverified
Masked Unfairness: Hiding Causality within Zero ATE	Mar 7, 2026	—Unverified
MAviS: A Multimodal Conversational Assistant For Avian Species	Mar 7, 2026	—Unverified
Learning Clinical Representations Under Systematic Distribution Shift	Mar 7, 2026	—Unverified
Learning to Reflect: Hierarchical Multi-Agent Reinforcement Learning for CSI-Free mmWave Beam-Focusing	Mar 7, 2026	—Unverified
Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios	Mar 7, 2026	—Unverified
Cold-Start Active Correlation Clustering	Mar 7, 2026	—Unverified
Reliable Grid Forecasting: State Space Models for Safety-Critical Energy Systems	Mar 7, 2026	—Unverified
Towards Strategic Persuasion with Language Models	Mar 7, 2026	—Unverified
Faster Gradient Methods for Highly-Smooth Stochastic Bilevel Optimization	Mar 7, 2026	—Unverified
SAGA: Selective Adaptive Gating for Efficient and Expressive Linear Attention	Mar 7, 2026	—Unverified