The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7601–7650 of 661570 papers

Title	Date	Status	Hype
VisiFold: Long-Term Traffic Forecasting via Temporal Folding Graph and Node Visibility	Mar 12, 2026	CodeCode Available	0
Think While Watching: Online Streaming Segment-Level Memory for Multi-Turn Video Reasoning in Multimodal Large Language Models	Mar 12, 2026	CodeCode Available	0
AS-Bridge: A Bidirectional Generative Framework Bridging Next-Generation Astronomical Surveys	Mar 12, 2026	CodeCode Available	0
Few-for-Many Personalized Federated Learning	Mar 12, 2026	CodeCode Available	0
SceneAssistant: A Visual Feedback Agent for Open-Vocabulary 3D Scene Generation	Mar 12, 2026	CodeCode Available	0
Less Data, Faster Convergence: Goal-Driven Data Optimization for Multimodal Instruction Tuning	Mar 12, 2026	CodeCode Available	0
Personalized Feature Translation for Expression Recognition: An Efficient Source-Free Domain Adaptation Method	Mar 12, 2026	CodeCode Available	0
Controllable Exploration in Hybrid-Policy RLVR for Multi-Modal Reasoning	Mar 12, 2026	CodeCode Available	0
Spatial-TTT: Streaming Visual-based Spatial Intelligence with Test-Time Training	Mar 12, 2026	—Unverified	2
Sparking Scientific Creativity via LLM-Driven Interdisciplinary Inspiration	Mar 12, 2026	—Unverified	1
WideSeek-R1: Exploring Width Scaling for Broad Information Seeking via Multi-Agent Reinforcement Learning	Mar 12, 2026	—Unverified	7
OmniStream: Mastering Perception, Reconstruction and Action in Continuous Streams	Mar 12, 2026	—Unverified	2
Trust Your Critic: Robust Reward Modeling and Reinforcement Learning for Faithful Image Editing and Generation	Mar 12, 2026	—Unverified	1
GRADE: Benchmarking Discipline-Informed Reasoning in Image Editing	Mar 12, 2026	—Unverified	1
Strategic Navigation or Stochastic Search? How Agents and Humans Reason Over Document Collections	Mar 12, 2026	—Unverified	1
Toward Complex-Valued Neural Networks for Waveform Generation	Mar 12, 2026	—Unverified	1
FlashMotion: Few-Step Controllable Video Generation with Trajectory Guidance	Mar 12, 2026	—Unverified	1
VolSplat: Rethinking Feed-Forward 3D Gaussian Splatting with Voxel-Aligned Prediction	Mar 12, 2026	—Unverified	3
Mobile-GS: Real-time Gaussian Splatting for Mobile Devices	Mar 12, 2026	—Unverified	2
Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem	Mar 12, 2026	—Unverified	7
One Model, Many Budgets: Elastic Latent Interfaces for Diffusion Transformers	Mar 12, 2026	—Unverified	1
Multi-Crit: Benchmarking Multimodal Judges on Pluralistic Criteria-Following	Mar 12, 2026	—Unverified	1
MedEyes: Learning Dynamic Visual Focus for Medical Progressive Diagnosis	Mar 12, 2026	CodeCode Available	0
RADAR: Closed-Loop Robotic Data Generation via Semantic Planning and Autonomous Causal Environment Reset	Mar 12, 2026	—Unverified	0
HCP-DCNet: A Hierarchical Causal Primitive Dynamic Composition Network for Self-Improving Causal Understanding	Mar 12, 2026	—Unverified	0
Budget-Sensitive Discovery Scoring: A Formally Verified Framework for Evaluating AI-Guided Scientific Selection	Mar 12, 2026	—Unverified	0
Taming OpenClaw: Security Analysis and Mitigation of Autonomous LLM Agent Threats	Mar 12, 2026	—Unverified	0
ProtoDCS: Towards Robust and Efficient Open-Set Test-Time Adaptation for Vision-Language Models	Mar 12, 2026	CodeCode Available	0
EgoIntent: An Egocentric Step-level Benchmark for Understanding What, Why, and Next	Mar 12, 2026	—Unverified	0
SPEGC: Continual Test-Time Adaptation via Semantic-Prompt-Enhanced Graph Clustering for Medical Image Segmentation	Mar 12, 2026	CodeCode Available	0
Agentic Explainable Artificial Intelligence (Agentic XAI) Approach To Explore Better Explanation	Mar 12, 2026	—Unverified	0
AdaFuse: Accelerating Dynamic Adapter Inference via Token-Level Pre-Gating and Fused Kernel Optimization	Mar 12, 2026	—Unverified	0
SimulCost: A Cost-Aware Benchmark and Toolkit for Automating Physics Simulations with LLMs	Mar 11, 2026	—Unverified	0
TIPS: Turn-Level Information-Potential Reward Shaping for Search-Augmented LLMs	Mar 11, 2026	—Unverified	0
The Deep-Match Framework for Event-Related Potential Detection in EEG	Mar 11, 2026	—Unverified	0
FinReflectKG -- HalluBench: GraphRAG Hallucination Benchmark for Financial Question Answering Systems	Mar 11, 2026	—Unverified	0
AI Detectors Fail Diverse Student Populations: A Mathematical Framing of Structural Detection Limits	Mar 11, 2026	—Unverified	0
Abjad-Kids: An Arabic Speech Classification Dataset for Primary Education	Mar 11, 2026	—Unverified	0
SciNav: A General Agent Framework for Scientific Coding Tasks	Mar 11, 2026	—Unverified	0
PRIME-CVD: A Parametrically Rendered Informatics Medical Environment for Education in Cardiovascular Risk Modelling	Mar 11, 2026	—Unverified	0
BrainSCL: Subtype-Guided Contrastive Learning for Brain Disorder Diagnosis	Mar 11, 2026	—Unverified	0
TTQ: Activation-Aware Test-Time Quantization to Accelerate LLM Inference On The Fly	Mar 11, 2026	—Unverified	0
CLaRE-ty Amid Chaos: Quantifying Representational Entanglement to Predict Ripple Effects in LLM Editing	Mar 11, 2026	—Unverified	0
A Dynamic Bayesian and Machine Learning Framework for Quantitative Evaluation and Prediction of Operator Situation Awareness in Nuclear Power Plants	Mar 11, 2026	—Unverified	0
Parameter-Efficient Token Embedding Editing for Clinical Class-Level Unlearning	Mar 11, 2026	—Unverified	0
Taming Epilepsy: Mean Field Control of Whole-Brain Dynamics	Mar 11, 2026	—Unverified	0
SimulU: Training-free Policy for Long-form Simultaneous Speech-to-Speech Translation	Mar 11, 2026	—Unverified	0
Comparative Analysis of Deep Learning Architectures for Multi-Disease Classification of Single-Label Chest X-rays	Mar 11, 2026	—Unverified	0
QV May Be Enough: Toward the Essence of Attention in LLMs	Mar 11, 2026	—Unverified	0
Querying Everything Everywhere All at Once: Supervaluationism for the Agentic Lakehouse	Mar 11, 2026	—Unverified	0