The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2501–2550 of 659983 papers

Title	Date	Status	Hype
Optimizer-Induced Low-Dimensional Drift and Transverse Dynamics in Transformer Training	Mar 18, 2026	—Unverified	0
Developing a Discrete-Event Simulator of School Shooter Behavior from VR Data	Mar 18, 2026	—Unverified	0
Optimal rates for density and mode estimation with expand-and-sparsify representations	Mar 18, 2026	—Unverified	0
Equivariant symmetry-aware head pose estimation for fetal MRI	Mar 18, 2026	CodeCode Available	0
Efficient and Scalable Monocular Human-Object Interaction Motion Reconstruction	Mar 18, 2026	CodeCode Available	0
Multimodal Machine Learning for Soft High-k Elastomers under Data Scarcity	Mar 18, 2026	CodeCode Available	0
EPOFusion: Exposure aware Progressive Optimization Method for Infrared and Visible Image Fusion	Mar 18, 2026	CodeCode Available	0
SSP-SAM: SAM with Semantic-Spatial Prompt for Referring Expression Segmentation	Mar 18, 2026	CodeCode Available	0
Sharpness-Aware Minimization in Logit Space Efficiently Enhances Direct Preference Optimization	Mar 18, 2026	CodeCode Available	0
Approximate Subgraph Matching with Neural Graph Representations and Reinforcement Learning	Mar 18, 2026	CodeCode Available	0
ARISE: Agent Reasoning with Intrinsic Skill Evolution in Hierarchical Reinforcement Learning	Mar 18, 2026	CodeCode Available	0
Don't Pass@k: A Bayesian Framework for Large Language Model Evaluation	Mar 18, 2026	CodeCode Available	0
Theory of Code Space: Do Code Agents Understand Software Architecture?	Mar 18, 2026	CodeCode Available	0
GRAFITE: Generative Regression Analysis Framework for Issue Tracking and Evaluation	Mar 18, 2026	CodeCode Available	0
AgentFactory: A Self-Evolving Framework Through Executable Subagent Accumulation and Reuse	Mar 18, 2026	CodeCode Available	0
DREAM: A Benchmark Study for Deepfake photoREalism AssessMent	Mar 18, 2026	CodeCode Available	0
MLLM-based Textual Explanations for Face Comparison	Mar 18, 2026	CodeCode Available	0
Training-Only Heterogeneous Image-Patch-Text Graph Supervision for Advancing Few-Shot Learning Adapters	Mar 18, 2026	CodeCode Available	0
R2-Dreamer: Redundancy-Reduced World Models without Decoders or Augmentation	Mar 18, 2026	CodeCode Available	0
Open-o3-Video: Grounded Video Reasoning with Explicit Spatio-Temporal Evidence	Mar 18, 2026	—Unverified	2
MOSS-TTS Technical Report	Mar 18, 2026	—Unverified	4
LoST: Level of Semantics Tokenization for 3D Shapes	Mar 18, 2026	—Unverified	2
OPUS-VFL: Incentivizing Optimal Privacy-Utility Tradeoffs in Vertical Federated Learning	Mar 18, 2026	—Unverified	0
Insight-V++: Towards Advanced Long-Chain Visual Reasoning with Multimodal Large Language Models	Mar 18, 2026	—Unverified	0
Omnilingual SONAR: Cross-Lingual and Cross-Modal Sentence Embeddings Bridging Massively Multilingual Text and Speech	Mar 18, 2026	—Unverified	0
M2P: Improving Visual Foundation Models with Mask-to-Point Weakly-Supervised Learning for Dense Point Tracking	Mar 18, 2026	—Unverified	0
Anchoring and Rescaling Attention for Semantically Coherent Inbetweening	Mar 18, 2026	—Unverified	0
CARPE: Context-Aware Image Representation Prioritization via Ensemble for Large Vision-Language Models	Mar 18, 2026	—Unverified	0
Computing Pure-Strategy Nash Equilibria in a Two-Party Policy Competition: Existence and Algorithmic Approaches	Mar 18, 2026	—Unverified	0
SHIFT: Motion Alignment in Video Diffusion Models with Adversarial Hybrid Fine-Tuning	Mar 18, 2026	—Unverified	0
Beyond bouba/kiki: Multidimensional semantic signals are deeply woven into the fabric of natural language	Mar 18, 2026	—Unverified	0
rSDNet: Unified Robust Neural Learning against Label Noise and Adversarial Attacks	Mar 18, 2026	—Unverified	0
Gender Disambiguation in Machine Translation: Diagnostic Evaluation in Decoder-Only Architectures	Mar 18, 2026	—Unverified	0
VirPro: Visual-referred Probabilistic Prompt Learning for Weakly-Supervised Monocular 3D Detection	Mar 18, 2026	—Unverified	0
DeepCORO-CLIP: A Multi-View Foundation Model for Comprehensive Coronary Angiography Video-Text Analysis and External Validation	Mar 18, 2026	—Unverified	0
AutoMoT: A Unified Vision-Language-Action Model with Asynchronous Mixture-of-Transformers for End-to-End Autonomous Driving	Mar 18, 2026	—Unverified	0
Bootstrapping Coding Agents: The Specification Is the Program	Mar 18, 2026	—Unverified	0
Anisotropic Permeability Tensor Prediction from Porous Media Microstructure via Physics-Informed Progressive Transfer Learning with Hybrid CNN-Transformer	Mar 18, 2026	—Unverified	0
MATA: Mindful Assessment of the Telugu Abilities of Large Language Models	Mar 18, 2026	—Unverified	0
Graph-Native Cognitive Memory for AI Agents: Formal Belief Revision Semantics for Versioned Memory Architectures	Mar 18, 2026	—Unverified	0
3D MRI-Based Alzheimer's Disease Classification Using Multi-Modal 3D CNN with Leakage-Aware Subject-Level Evaluation	Mar 18, 2026	—Unverified	0
AURORA Model of Formant-to-Tongue Inversion for Didactic and Clinical Applications	Mar 18, 2026	—Unverified	0
Video Understanding: From Geometry and Semantics to Unified Models	Mar 18, 2026	—Unverified	0
Bringing Emerging Architectures to Sequence Labeling in NLP	Mar 18, 2026	—Unverified	0
In Trust We Survive: Emergent Trust Learning	Mar 18, 2026	—Unverified	0
Fast weight programming and linear transformers: from machine learning to neurobiology	Mar 18, 2026	—Unverified	0
Robust estimation of heterogeneous treatment effects in randomized trials leveraging external data	Mar 18, 2026	—Unverified	0
MLlm-DR: Towards Explainable Depression Recognition with MultiModal Large Language Models	Mar 18, 2026	—Unverified	0
Towards Inclusive Communication: A Unified Framework for Generating Spoken Language from Sign, Lip, and Audio	Mar 18, 2026	—Unverified	0
AVIATOR: Towards AI-Agentic Vulnerability Injection Workflow for High-Fidelity, Large-Scale Code Security Dataset	Mar 18, 2026	—Unverified	0