The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

510,095 papers251,776 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–350 of 510095 papers

Title	Date	Status
Mastermind: Strategy-grounded Learning for Repository-Scale Vulnerability Reproduction	Jul 2, 2026	—Unverified
SimWorlds: A Multi-Agent System for Dynamic 3D Scene Creation	Jul 2, 2026	—Unverified
Repair the Amplifier, Not the Symptom: Stable World-Model Correction for Agent Rollouts	Jul 2, 2026	—Unverified
JointHOI: Jointly Generating Contact Maps Enhances Hand Object Interaction Generation	Jul 2, 2026	—Unverified
LLM-Empowered Multimodal Fusion Framework for Autonomous Driving: Semantic Enhancement and Channel-Adaptive Design	Jul 2, 2026	—Unverified
Verifiable Knowledge Expansion through Retrieval-Grounded Formal Concept Analysis	Jul 2, 2026	—Unverified
Scene-Conditioned PINN-GNN for Multipath RF Maps: Cross-Scene Generation and In-Scene Completion	Jul 2, 2026	—Unverified
SpaceEra++: A Unified Framework Towards 3D Spatial Reasoning in Video	Jul 2, 2026	—Unverified
EHHN: An Event-driven Heterogeneous Hypergraph Network for Object-Centric Next Activity Prediction	Jul 2, 2026	—Unverified
EPnG: Adaptive Expert Prune-and-Grow for Parameter-Efficient MoE Fine-tuning	Jul 2, 2026	—Unverified
PARTREP: Learning What to Repeat for Decoder-only LLMs	Jul 2, 2026	—Unverified
Safety Testing LLM Agents at Scale: From Risk Discovery to Evidence-Grounded Verification	Jul 2, 2026	—Unverified
Lightweight Safe Reinforcement Learning for End-to-End UAV Navigation	Jul 2, 2026	—Unverified
Single-Channel EEG-Based Cognitive Load Assessment in Online Learning: A Hybrid Deep Learning Approach	Jul 2, 2026	—Unverified
Expander Sparse Autoencoders: Parameter-Efficient Dictionaries for Mechanistic Interpretability	Jul 2, 2026	—Unverified
Do LLMs Truly Generalize in the Molecular Domain? A Perturbation-Based Analysis	Jul 2, 2026	—Unverified
PixGS: Pixel-Space Diffusion for Direct 3D Gaussian Splat Generation	Jul 2, 2026	—Unverified
Decoupling Code Complexity from Newcomer Participation: A Causal Study of AI Coding Agent Adoption in OSS	Jul 2, 2026	—Unverified
MMBench-Live: A Continuously Evolving Benchmark for Multimodal Models	Jul 2, 2026	—Unverified
MMIR-TCM: Memory-Integrated Multimodal Inference and Retrieval for TCM Clinical Decision Support	Jul 2, 2026	—Unverified
Koopman operator theory: fundamentals, control, and applications	Jul 2, 2026	—Unverified
Self-Supervised Test-Time Tuning for Packet Loss Concealment	Jul 2, 2026	—Unverified
Gaming Consensus: Coordinated Manipulation in Crowdsourced Fact-Checking	Jul 2, 2026	—Unverified
Rethinking Conditional Generation for Underwater Salient Object Detection	Jul 2, 2026	—Unverified
C2E: Boosting Ego-Only 3D Object Detection via Multi-Teacher Contrastive Knowledge Distillation	Jul 2, 2026	—Unverified
Gender Differences in Research Topic and Method Selection in Library and Information Science: Perspectives from Three Top Journals	Jul 2, 2026	—Unverified
Lynx: Progressive Speculative Quantization for accelerating KV Transfer in Long-Context Inference	Jul 2, 2026	—Unverified
Non-synchronism in Global Usage of Research Methods in Library and Information Science from 1990 to 2019	Jul 2, 2026	—Unverified
Adaptive Group-Based Counterfactual Explanations for Time-Series Rehabilitation Data	Jul 2, 2026	—Unverified
Actual causality in fault trees	Jul 2, 2026	—Unverified
Mixture-of-Parallelisms: Towards Memory-Efficient Training Stack for Mixture-of-Experts Models	Jul 2, 2026	—Unverified
CLAP: Closed-Loop Training, Evaluation, and Release Control for Domain Agent Post-training	Jul 2, 2026	—Unverified
Decomposer: Learning to Decompile Symbolic Music to Programs	Jul 2, 2026	—Unverified
Geometric Foundation Model Distillation for Efficient Lunar 3D Reconstruction	Jul 2, 2026	—Unverified
Evaluating Chunking Strategies for Retrieval-Augmented Generation on Academic Texts	Jul 2, 2026	—Unverified
Has This Checkpoint Been Abliterated? A Two-Signal Audit and Its Failure Map	Jul 2, 2026	—Unverified
Safety Targeted Embedding Exploit via Refinement	Jul 2, 2026	—Unverified
DL-SLAM: Enabling High-Fidelity Gaussian Splatting SLAM in Dynamic Environments based on Dual-Level Probability	Jul 2, 2026	—Unverified
An Exploratory Study on LLM-Generated Code and Comments in Code Repositories	Jul 2, 2026	—Unverified
QWERTY: Training-Free Motion Control via Query-Warped Video Diffusion Transformers	Jul 2, 2026	—Unverified
SkillCoach: Self-Evolving Rubrics for Evaluating and Enhancing Agentic Skill-Use	Jul 2, 2026	—Unverified
SAB-LVLM: Significance-Aware Binarization for Large Vision-Language Models	Jul 2, 2026	—Unverified
Learning the Supports for Categorical Critic in Reinforcement Learning	Jul 2, 2026	—Unverified
PairCoder++: Pair Programming as a Universal Paradigm for Verified Code-Driven Multimodal and Structured-Artifact Generation	Jul 2, 2026	—Unverified
Diversity-aware View Partitioning for Scalable VGGT	Jul 2, 2026	—Unverified
Spec-AUF: Accept-Until-Fail Training under Train-Inference Misalignment for Masked Block Drafters	Jul 2, 2026	—Unverified
Regularized Variational and Spectral Log-Density-Ratio Estimation in the Gaussian Location Model	Jul 2, 2026	—Unverified
Rank-Then-Act: Reward-Free Control from Frame-Order Progress	Jul 2, 2026	—Unverified
FoundDP: Revisiting Weak Disparity Observability in Dual-Pixel Depth Estimation	Jul 2, 2026	—Unverified
SABER: A Semantic-Aligned Brain Network Analysis Framework via Multi-scale Hypergraphs	Jul 2, 2026	—Unverified