The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 474278 papers

Title	Date	Status
Multimodal Dataset Distillation via Phased Teacher Models	Mar 26, 2026	—Unverified
FSGNet: A Frequency-Aware and Semantic Guidance Network for Infrared Small Target Detection	Mar 26, 2026	—Unverified
RealRestorer: Towards Generalizable Real-World Image Restoration with Large-Scale Image Editing Models	Mar 26, 2026	—Unverified
Pose-Free Omnidirectional Gaussian Splatting for 360-Degree Videos with Consistent Depth Priors	Mar 26, 2026	—Unverified
CardioDiT: Latent Diffusion Transformers for 4D Cardiac MRI Synthesis	Mar 26, 2026	—Unverified
SafeMath: Inference-time Safety improves Math Accuracy	Mar 26, 2026	—Unverified
Free-Lunch Long Video Generation via Layer-Adaptive O.O.D Correction	Mar 26, 2026	—Unverified
Towards Practical Lossless Neural Compression for LiDAR Point Clouds	Mar 26, 2026	—Unverified
Adaptive Learned Image Compression with Graph Neural Networks	Mar 26, 2026	—Unverified
MACRO: Advancing Multi-Reference Image Generation with Structured Long-Context Data	Mar 26, 2026	—Unverified
Adaptive Chunking: Optimizing Chunking-Method Selection for RAG	Mar 26, 2026	—Unverified
PMT: Plain Mask Transformer for Image and Video Segmentation with Frozen Vision Encoders	Mar 26, 2026	—Unverified
From Manipulation to Mistrust: Explaining Diverse Micro-Video Misinformation for Robust Debunking in the Wild	Mar 26, 2026	—Unverified
AdaSFormer: Adaptive Serialized Transformers for Monocular Semantic Scene Completion from Indoor Environments	Mar 26, 2026	—Unverified
Humans vs Vision-Language Models: A Unified Measure of Narrative Coherence	Mar 26, 2026	—Unverified
Elucidating the Design Space of Flow Matching for Cellular Microscopy	Mar 25, 2026	—Unverified
Brain-Inspired Multimodal Spiking Neural Network for Image-Text Retrieval	Mar 25, 2026	—Unverified
SlopCodeBench: Benchmarking How Coding Agents Degrade Over Long-Horizon Iterative Tasks	Mar 25, 2026	—Unverified
UniICL: Systematizing Unified Multimodal In-context Learning through a Capability-Oriented Taxonomy	Mar 25, 2026	—Unverified
LLaVA-LE: Large Language-and-Vision Assistant for Lunar Exploration	Mar 25, 2026	—Unverified
Scalable Object Relation Encoding for Better 3D Spatial Reasoning in Large Language Models	Mar 25, 2026	—Unverified
Is Geometry Enough? An Evaluation of Landmark-Based Gaze Estimation	Mar 25, 2026	—Unverified
Calibri: Enhancing Diffusion Transformers via Parameter-Efficient Calibration	Mar 25, 2026	—Unverified
Generative Adversarial Perturbations with Cross-paradigm Transferability on Localized Crowd Counting	Mar 25, 2026	—Unverified
A Practical Guide Towards Interpreting Time-Series Deep Clinical Predictive Models: A Reproducibility Study	Mar 25, 2026	—Unverified
Prune as You Generate: Online Rollout Pruning for Faster and Better RLVR	Mar 25, 2026	—Unverified
Reaching Beyond the Mode: RL for Distributional Reasoning in Language Models	Mar 25, 2026	—Unverified
ReLope: KL-Regularized LoRA Probes for Multimodal LLM Routing	Mar 25, 2026	—Unverified
Demystifying When Pruning Works via Representation Hierarchies	Mar 25, 2026	—Unverified
ReDiPrune: Relevance-Diversity Pre-Projection Token Pruning for Efficient Multimodal LLMs	Mar 25, 2026	—Unverified
Accurate Point Measurement in 3DGS -- A New Alternative to Traditional Stereoscopic-View Based Measurements	Mar 25, 2026	—Unverified
Decentralized Task Scheduling in Distributed Systems: A Deep Reinforcement Learning Approach	Mar 25, 2026	—Unverified
Light Cones For Vision: Simple Causal Priors For Visual Hierarchy	Mar 25, 2026	—Unverified
FilterGS: Traversal-Free Parallel Filtering and Adaptive Shrinking for Large-Scale LoD 3D Gaussian Splatting	Mar 25, 2026	—Unverified
Understanding the Challenges in Iterative Generative Optimization with LLMs	Mar 25, 2026	—Unverified
Problems with Chinchilla Approach 2: Systematic Biases in IsoFLOP Parabola Fits	Mar 25, 2026	—Unverified
MLLM-HWSI: A Multimodal Large Language Model for Hierarchical Whole Slide Image Understanding	Mar 25, 2026	—Unverified
Grounding Arabic LLMs in the Doha Historical Dictionary: Retrieval-Augmented Understanding of Quran and Hadith	Mar 25, 2026	—Unverified
Thinking with Tables: Enhancing Multi-Modal Tabular Understanding via Neuro-Symbolic Reasoning	Mar 25, 2026	—Unverified
From Oracle to Noisy Context: Mitigating Contextual Exposure Bias in Speech-LLMs	Mar 25, 2026	—Unverified
A^3: Towards Advertising Aesthetic Assessment	Mar 25, 2026	—Unverified
Hierarchical Spatial-Temporal Graph-Enhanced Model for Map-Matching	Mar 25, 2026	—Unverified
LaDy: Lagrangian-Dynamic Informed Network for Skeleton-based Action Segmentation via Spatial-Temporal Modulation	Mar 25, 2026	—Unverified
CarePilot: A Multi-Agent Framework for Long-Horizon Computer Task Automation in Healthcare	Mar 25, 2026	—Unverified
Memory-Augmented Vision-Language Agents for Persistent and Semantically Consistent Object Captioning	Mar 25, 2026	—Unverified
Cost-Sensitive Neighborhood Aggregation for Heterophilous Graphs: When Does Per-Edge Routing Help?	Mar 25, 2026	—Unverified
PP-OCRv5: A Specialized 5M-Parameter Model Rivaling Billion-Parameter Vision-Language Models on OCR Tasks	Mar 25, 2026	—Unverified
Claudini: Autoresearch Discovers State-of-the-Art Adversarial Attack Algorithms for LLMs	Mar 25, 2026	—Unverified
UI-Voyager: A Self-Evolving GUI Agent Learning via Failed Experience	Mar 25, 2026	—Unverified
CliPPER: Contextual Video-Language Pretraining on Long-form Intraoperative Surgical Procedures for Event Recognition	Mar 25, 2026	—Unverified