The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8476–8500 of 474278 papers

Title	Date	Status
VisuRiddles: Fine-grained Perception is a Primary Bottleneck for Multimodal Large Language Models in Abstract Visual Reasoning	Oct 21, 2025	CodeCode Available
Polyline Path Masked Attention for Vision Transformer	Oct 21, 2025	CodeCode Available
ComputerRL: Scaling End-to-End Online Reinforcement Learning for Computer Use Agents	Oct 21, 2025	CodeCode Available
Taming the Judge: Deconflicting AI Feedback for Stable Reinforcement Learning	Oct 21, 2025	CodeCode Available
EMA-SAM: Exponential Moving-average for SAM-based PTMC Segmentation	Oct 21, 2025	CodeCode Available
NTKMTL: Mitigating Task Imbalance in Multi-Task Learning from Neural Tangent Kernel Perspective	Oct 21, 2025	CodeCode Available
Beyond Single Models: Mitigating Multimodal Hallucinations via Adaptive Token Ensemble Decoding	Oct 21, 2025	CodeCode Available
Training Diverse Graph Experts for Ensembles: A Systematic Empirical Study	Oct 21, 2025	CodeCode Available
Learning with Dual-level Noisy Correspondence for Multi-modal Entity Alignment	Oct 21, 2025	CodeCode Available
Variance-Reduction Guidance: Sampling Trajectory Optimization for Diffusion Models	Oct 20, 2025	CodeCode Available
2D_3D Feature Fusion via Cross-Modal Latent Synthesis and Attention Guided Restoration for Industrial Anomaly Detection	Oct 20, 2025	CodeCode Available
OmniCast: A Masked Latent Diffusion Model for Weather Forecasting Across Time Scales	Oct 20, 2025	CodeCode Available
CourtGuard: A Local, Multiagent Prompt Injection Classifier	Oct 20, 2025	CodeCode Available
SSL4Eco: A Global Seasonal Dataset for Geospatial Foundation Models in Ecology	Oct 20, 2025	CodeCode Available
CARDIUM: Congenital Anomaly Recognition with Diagnostic Images and Unified Medical records	Oct 20, 2025	CodeCode Available
REACT-KD: Region-Aware Cross-modal Topological Knowledge Distillation for Interpretable Medical Image Classification	Oct 20, 2025	CodeCode Available
UniRL-Zero: Reinforcement Learning on Unified Models with Joint Language Model and Diffusion Model Experts	Oct 20, 2025	CodeCode Available
Is Multilingual LLM Watermarking Truly Multilingual? A Simple Back-Translation Solution	Oct 20, 2025	—Unverified
Styl3R: Instant 3D Stylized Reconstruction for Arbitrary Scenes and Styles	Oct 20, 2025	—Unverified
Does Math Reasoning Improve General LLM Capabilities? Understanding Transferability of LLM Reasoning	Oct 20, 2025	—Unverified
ReDi: Rectified Discrete Flow	Oct 20, 2025	CodeCode Available
VimoRAG: Video-based Retrieval-augmented 3D Motion Generation for Motion Language Models	Oct 20, 2025	—Unverified
From AI for Science to Agentic Science: A Survey on Autonomous Scientific Discovery	Oct 20, 2025	—Unverified
Nearest-Class Mean and Logits Agreement for Wildlife Open-Set Recognition	Oct 20, 2025	CodeCode Available
Towards Mixed-Modal Retrieval for Universal Retrieval-Augmented Generation	Oct 20, 2025	—Unverified