The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,984 papers248,105 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3301–3350 of 659984 papers

Title	Date	Status
ExpressMind: A Multimodal Pretrained Large Language Model for Expressway Operation	Mar 17, 2026	—Unverified
CompDiff: Hierarchical Compositional Diffusion for Fair and Zero-Shot Intersectional Medical Image Generation	Mar 17, 2026	—Unverified
EmoLLM: Appraisal-Grounded Cognitive-Emotional Co-Reasoning in Large Language Models	Mar 17, 2026	—Unverified
Characterizing Delusional Spirals through Human-LLM Chat Logs	Mar 17, 2026	—Unverified
V-DyKnow: A Dynamic Benchmark for Time-Sensitive Knowledge in Vision Language Models	Mar 17, 2026	—Unverified
What if Pinocchio Were a Reinforcement Learning Agent: A Normative End-to-End Pipeline	Mar 17, 2026	—Unverified
x^2-Fusion: Cross-Modality and Cross-Dimension Flow Estimation in Event Edge Space	Mar 17, 2026	—Unverified
CritiSense: Critical Digital Literacy and Resilience Against Misinformation	Mar 17, 2026	—Unverified
Novelty-Driven Target-Space Discovery in Automated Electron and Scanning Probe Microscopy	Mar 17, 2026	—Unverified
Federated Learning with Multi-Partner OneFlorida+ Consortium Data for Predicting Major Postoperative Complications	Mar 17, 2026	—Unverified
V-Co: A Closer Look at Visual Representation Alignment via Co-Denoising	Mar 17, 2026	—Unverified
Adaptive Moments are Surprisingly Effective for Plug-and-Play Diffusion Sampling	Mar 17, 2026	—Unverified
Is Conformal Factuality for RAG-based LLMs Robust? Novel Metrics and Systematic Insights	Mar 17, 2026	—Unverified
Deep Reinforcement Learning-driven Edge Offloading for Latency-constrained XR pipelines	Mar 17, 2026	—Unverified
An assessment of data-centric methods for label noise identification in remote sensing data sets	Mar 17, 2026	—Unverified
Mediocrity is the key for LLM as a Judge Anchor Selection	Mar 17, 2026	—Unverified
Unifying Optimization and Dynamics to Parallelize Sequential Computation: A Guide to Parallel Newton Methods for Breaking Sequential Bottlenecks	Mar 17, 2026	—Unverified
SOMA: Unifying Parametric Human Body Models	Mar 17, 2026	—Unverified
Chronos: Temporal-Aware Conversational Agents with Structured Event Retrieval for Long-Term Memory	Mar 17, 2026	—Unverified
MessyKitchens: Contact-rich object-level 3D scene reconstruction	Mar 17, 2026	—Unverified
Enhancing Moral Diagnosis and Correction in Large Language Models	Mar 17, 2026	—Unverified
REFINE-DP: Diffusion Policy Fine-tuning for Humanoid Loco-manipulation via Reinforcement Learning	Mar 17, 2026	—Unverified
PhysQuantAgent: An Inference Pipeline of Mass Estimation for Vision-Language Models	Mar 17, 2026	—Unverified
MSRAMIE: Multimodal Structured Reasoning Agent for Multi-instruction Image Editing	Mar 17, 2026	—Unverified
Hybrid Classical-Quantum Transfer Learning with Noisy Quantum Circuits	Mar 17, 2026	—Unverified
Implementation of tangent linear and adjoint models for neural networks based on a compiler library tool	Mar 17, 2026	—Unverified
Early Quantization Shrinks Codebook: A Simple Fix for Diversity-Preserving Tokenization	Mar 17, 2026	—Unverified
SYMDIREC: A Neuro-Symbolic Divide-Retrieve-Conquer Framework for Enhanced RTL Synthesis and Summarization	Mar 17, 2026	—Unverified
Generative AI-assisted Participatory Modeling in Socio-Environmental Planning under Deep Uncertainty	Mar 17, 2026	—Unverified
SMAL-pets: SMAL Based Avatars of Pets from Single Image	Mar 17, 2026	—Unverified
Contextual Preference Distribution Learning	Mar 17, 2026	—Unverified
How Clued up are LLMs? Evaluating Multi-Step Deductive Reasoning in a Text-Based Game Environment	Mar 17, 2026	—Unverified
Towards Unsupervised Adversarial Document Detection in Retrieval Augmented Generation Systems	Mar 17, 2026	—Unverified
Conditional Distributional Treatment Effects: Doubly Robust Estimation and Testing	Mar 17, 2026	—Unverified
Masked Auto-Regressive Variational Acceleration: Fast Inference Makes Practical Reinforcement Learning	Mar 17, 2026	—Unverified
DeepStage: Learning Autonomous Defense Policies Against Multi-Stage APT Campaigns	Mar 17, 2026	—Unverified
Age Predictors Through the Lens of Generalization, Bias Mitigation, and Interpretability: Reflections on Causal Implications	Mar 17, 2026	—Unverified
Scalable Sample-Level Causal Discovery in Event Sequences via Autoregressive Density Estimation	Mar 17, 2026	—Unverified
VALD: Multi-Stage Vision Attack Detection for Efficient LVLM Defense	Mar 17, 2026	—Unverified
From the Inside Out: Progressive Distribution Refinement for Confidence Calibration	Mar 17, 2026	—Unverified
AgriChrono: A Multi-modal Dataset Capturing Crop Growth and Lighting Variability with a Field Robot	Mar 17, 2026	CodeCode Available
Diverging Transformer Predictions for Human Sentence Processing: A Comprehensive Analysis of Agreement Attraction Effects	Mar 17, 2026	—Unverified
HistoAtlas: A Pan-Cancer Morphology Atlas Linking Histomics to Molecular Programs and Clinical Outcomes	Mar 17, 2026	—Unverified
Segmentation-Based Attention Entropy: Detecting and Mitigating Object Hallucinations in Large Vision-Language Models	Mar 17, 2026	—Unverified
DanceHA: A Multi-Agent Framework for Document-Level Aspect-Based Sentiment Analysis	Mar 17, 2026	—Unverified
Order Matters: 3D Shape Generation from Sequential VR Sketches	Mar 17, 2026	—Unverified
PEPPER: Perception-Guided Perturbation for Robust Backdoor Defense in Text-to-Image Diffusion Models	Mar 17, 2026	—Unverified
Multilingual Reference Need Assessment System for Wikipedia	Mar 17, 2026	—Unverified
BEV-SLD: Self-Supervised Scene Landmark Detection for Global Localization with LiDAR Bird's-Eye View Images	Mar 17, 2026	—Unverified
Who's important? -- SUnSET: Synergistic Understanding of Stakeholder, Events and Time for Timeline Generation	Mar 17, 2026	—Unverified