The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3401–3450 of 659983 papers

Title	Date	Status	Hype
A Tri-Modal Dataset and a Baseline System for Tracking Unmanned Aerial Vehicles	Mar 17, 2026	—Unverified	0
MemX: A Local-First Long-Term Memory System for AI Assistants	Mar 17, 2026	—Unverified	0
Execution-Grounded Credit Assignment for GRPO in Code Generation	Mar 17, 2026	—Unverified	0
AI4EOSC: a Federated Cloud Platform for Artificial Intelligence in Scientific Research	Mar 17, 2026	—Unverified	0
FlowMotion: Training-Free Flow Guidance for Video Motion Transfer	Mar 17, 2026	—Unverified	0
CounterRefine: Answer-Conditioned Counterevidence Retrieval for Inference-Time Knowledge Repair in Factual Question Answering	Mar 17, 2026	—Unverified	0
AI-Generated Figures in Academic Publishing: Policies, Tools, and Practical Guidelines	Mar 17, 2026	—Unverified	0
Agile Interception of a Flying Target using Competitive Reinforcement Learning	Mar 17, 2026	—Unverified	0
Generative AI for Quantum Circuits and Quantum Code: A Technical Review and Taxonomy	Mar 17, 2026	—Unverified	0
CoMAI: A Collaborative Multi-Agent Framework for Robust and Equitable Interview Evaluation	Mar 17, 2026	—Unverified	0
USIS-PGM: Photometric Gaussian Mixtures for Underwater Salient Instance Segmentation	Mar 17, 2026	—Unverified	0
Large Language Models for Wireless Communications: From Adaptation to Autonomy	Mar 17, 2026	—Unverified	0
Relationship-Aware Safety Unlearning for Multimodal LLMs	Mar 17, 2026	—Unverified	0
Improved Iterative Refinement for Chart-to-Code Generation via Structured Instruction	Mar 17, 2026	—Unverified	0
Omni Survey for Multimodality Analysis in Visual Object Tracking	Mar 17, 2026	—Unverified	0
PhysGM: Large Physical Gaussian Model for Feed-Forward 4D Synthesis	Mar 17, 2026	—Unverified	0
Backpropagation-Free Test-Time Adaptation via Probabilistic Gaussian Alignment	Mar 17, 2026	—Unverified	0
Generalizable End-to-End Tool-Use RL with Synthetic CodeGym	Mar 17, 2026	—Unverified	0
SiniticMTError: A Machine Translation Dataset with Error Annotations for Sinitic Languages	Mar 17, 2026	—Unverified	0
Attribution-Guided Decoding	Mar 17, 2026	—Unverified	0
LTGS: Long-Term Gaussian Scene Chronology From Sparse View Updates	Mar 17, 2026	—Unverified	0
MARIS: Marine Open-Vocabulary Instance Segmentation with Geometric Enhancement and Semantic Alignment	Mar 17, 2026	—Unverified	0
Unbiased Object Detection Beyond Frequency with Visually Prompted Image Synthesis	Mar 17, 2026	—Unverified	0
PREFINE: Personalized Story Generation via Simulated User Critics and User-Specific Rubric Generation	Mar 17, 2026	—Unverified	0
Surfacing Subtle Stereotypes: A Multilingual, Debate-Oriented Evaluation of Modern LLMs	Mar 17, 2026	—Unverified	0
TAUE: Training-free Noise Transplant and Cultivation Diffusion Model	Mar 17, 2026	—Unverified	0
DKDS: A Benchmark Dataset of Degraded Kuzushiji Documents with Seals for Detection and Binarization	Mar 17, 2026	—Unverified	0
SpatialBench: Benchmarking Multimodal Large Language Models for Spatial Cognition	Mar 17, 2026	—Unverified	0
AIA: Rethinking Architecture Decoupling Strategy In Unified Multimodal Model	Mar 17, 2026	—Unverified	1
Long-LRM++: Preserving Fine Details in Feed-Forward Wide-Coverage Reconstruction	Mar 17, 2026	—Unverified	0
COREA: Coupled Relightable 3D Gaussians and SDFs for Efficient Normal Alignment	Mar 17, 2026	—Unverified	1
Vision-Language Models for Infrared Industrial Sensing in Additive Manufacturing Scene Description	Mar 17, 2026	—Unverified	0
DefVINS: Visual-Inertial Odometry for Deformable Scenes	Mar 17, 2026	—Unverified	0
Can Multimodal LLMs See Science Instruction? Benchmarking Pedagogical Reasoning in K-12 Classroom Videos	Mar 17, 2026	—Unverified	0
CARE: A Molecular-Guided Foundation Model with Adaptive Region Modeling for Whole Slide Image Analysis	Mar 17, 2026	—Unverified	0
Tau-BNO: Brain Neural Operator for Tau Transport Model	Mar 17, 2026	—Unverified	0
A Survey of Reinforcement Learning For Economics	Mar 17, 2026	—Unverified	0
EmoStory: Emotion-Aware Story Generation	Mar 17, 2026	—Unverified	0
Relaxed Efficient Acquisition of Context and Temporal Features	Mar 17, 2026	—Unverified	0
Attention Sinks Are Provably Necessary in Softmax Transformers: Evidence from Trigger-Conditional Tasks	Mar 17, 2026	—Unverified	0
APEX-Searcher: Augmenting LLMs' Search Capabilities through Agentic Planning and Execution	Mar 17, 2026	—Unverified	0
DiFlowDubber: Discrete Flow Matching for Automated Video Dubbing via Cross-Modal Alignment and Synchronization	Mar 17, 2026	—Unverified	0
Make it SING: Analyzing Semantic Invariants in Classifiers	Mar 17, 2026	—Unverified	0
Topology-Preserving Data Augmentation for Ring-Type Polygon Annotations	Mar 17, 2026	—Unverified	0
Informative Perturbation Selection for Uncertainty-Aware Post-hoc Explanations	Mar 17, 2026	—Unverified	0
Masked BRep Autoencoder via Hierarchical Graph Transformer	Mar 17, 2026	—Unverified	0
Analyzing Error Sources in Global Feature Effect Estimation	Mar 17, 2026	—Unverified	0
Physics-Informed Neural Systems for the Simulation of EUV Electromagnetic Wave Diffraction from a Lithography Mask	Mar 17, 2026	—Unverified	0
Tracking the Discriminative Axis: Dual Prototypes for Test-Time OOD Detection Under Covariate Shift	Mar 17, 2026	—Unverified	0
SAGE: Multi-Agent Self-Evolution for LLM Reasoning	Mar 17, 2026	—Unverified	0