The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2201–2250 of 659983 papers

Title	Date	Status	Hype
HiMu: Hierarchical Multimodal Frame Selection for Long Video Question Answering	Mar 19, 2026	—Unverified	0
UEPS: Robust and Efficient MRI Reconstruction	Mar 19, 2026	—Unverified	0
Interplay: Training Independent Simulators for Reference-Free Conversational Recommendation	Mar 19, 2026	—Unverified	0
Cross-Modal Rationale Transfer for Explainable Humanitarian Classification on Social Media	Mar 19, 2026	—Unverified	0
ZEBRAARENA: A Diagnostic Simulation Environment for Studying Reasoning-Action Coupling in Tool-Augmented LLMs	Mar 19, 2026	—Unverified	0
GEAR: Geography-knowledge Enhanced Analog Recognition Framework in Extreme Environments	Mar 19, 2026	—Unverified	0
Training-Free Sparse Attention for Fast Video Generation via Offline Layer-Wise Sparsity Profiling and Online Bidirectional Co-Clustering	Mar 19, 2026	—Unverified	0
Multimodal Model for Computational Pathology:Representation Learning and Image Compression	Mar 19, 2026	—Unverified	0
Thinking with Constructions: A Benchmark and Policy Optimization for Visual-Text Interleaved Geometric Reasoning	Mar 19, 2026	—Unverified	0
Agent Control Protocol: Admission Control for Agent Actions	Mar 19, 2026	CodeCode Available	0
STEP: Scientific Time-Series Encoder Pretraining via Cross-Domain Distillation	Mar 19, 2026	—Unverified	0
From ex(p) to poly: Gaussian Splatting with Polynomial Kernels	Mar 19, 2026	—Unverified	0
Seasoning Generative Models for a Generalization Aftertaste	Mar 19, 2026	—Unverified	0
Towards Interpretable Foundation Models for Retinal Fundus Images	Mar 19, 2026	—Unverified	0
BeamAgent: LLM-Aided MIMO Beamforming with Decoupled Intent Parsing and Alternating Optimization for Joint Site Selection and Precoding	Mar 19, 2026	—Unverified	0
Why Better Cross-Lingual Alignment Fails for Better Cross-Lingual Transfer: Case of Encoders	Mar 19, 2026	—Unverified	0
A Human-in/on-the-Loop Framework for Accessible Text Generation	Mar 19, 2026	—Unverified	0
I Can't Believe It's Corrupt: Evaluating Corruption in Multi-Agent Governance Systems	Mar 19, 2026	—Unverified	0
Kernel Single-Index Bandits: Estimation, Inference, and Learning	Mar 19, 2026	—Unverified	0
VGGT-360: Geometry-Consistent Zero-Shot Panoramic Depth Estimation	Mar 19, 2026	—Unverified	0
Best-of-Both-Worlds Multi-Dueling Bandits: Unified Algorithms for Stochastic and Adversarial Preferences under Condorcet and Borda Objectives	Mar 19, 2026	—Unverified	0
Book your room in the Turing Hotel! A symmetric and distributed Turing Test with multiple AIs and humans	Mar 19, 2026	—Unverified	0
Unleashing the Power of Simplicity: A Minimalist Strategy for State-of-the-Art Fingerprint Enhancement	Mar 19, 2026	—Unverified	0
FUMO: Prior-Modulated Diffusion for Single Image Reflection Removal	Mar 19, 2026	CodeCode Available	0
Em-Garde: A Propose-Match Framework for Proactive Streaming Video Understanding	Mar 19, 2026	—Unverified	0
FedTrident: Resilient Road Condition Classification Against Poisoning Attacks in Federated Learning	Mar 19, 2026	—Unverified	0
Numerical Considerations for the Construction of Karhunen-Loève Expansions	Mar 19, 2026	—Unverified	0
From Inference Efficiency to Embodied Efficiency: Revisiting Efficiency Metrics for Vision-Language-Action Models	Mar 19, 2026	—Unverified	0
Adaptive Regime-Aware Stock Price Prediction Using Autoencoder-Gated Dual Node Transformers with Reinforcement Learning Control	Mar 19, 2026	—Unverified	0
Hierarchical Latent Structure Learning through Online Inference	Mar 19, 2026	—Unverified	0
Few-shot Acoustic Synthesis with Multimodal Flow Matching	Mar 19, 2026	—Unverified	0
Improving RCT-Based Treatment Effect Estimation Under Covariate Mismatch via Calibrated Alignment	Mar 19, 2026	—Unverified	0
Tinted Frames: Question Framing Blinds Vision-Language Models	Mar 19, 2026	—Unverified	0
FinTradeBench: A Financial Reasoning Benchmark for LLMs	Mar 19, 2026	—Unverified	0
Under One Sun: Multi-Object Generative Perception of Materials and Illumination	Mar 19, 2026	—Unverified	0
Learning-to-Defer with Expert-Conditioned Advice	Mar 19, 2026	—Unverified	0
iSatCR: Graph-Empowered Joint Onboard Computing and Routing for LEO Data Delivery	Mar 19, 2026	—Unverified	0
3DreamBooth: High-Fidelity 3D Subject-Driven Video Generation Model	Mar 19, 2026	—Unverified	1
Attack by Unlearning: Unlearning-Induced Adversarial Attacks on Graph Neural Networks	Mar 19, 2026	—Unverified	0
Inst4DGS: Instance-Decomposed 4D Gaussian Splatting with Multi-Video Label Permutation Learning	Mar 19, 2026	—Unverified	0
TopoChunker: Topology-Aware Agentic Document Chunking Framework	Mar 19, 2026	—Unverified	0
Nonparametric Variational Differential Privacy via Embedding Parameter Clipping	Mar 19, 2026	—Unverified	0
AdaSwitch: Balancing Exploration and Guidance in Knowledge Distillation via Adaptive Switching	Mar 19, 2026	—Unverified	0
Affect Decoding in Phonated and Silent Speech Production from Surface EMG	Mar 19, 2026	—Unverified	0
Social Simulacra in the Wild: AI Agent Communities on Moltbook	Mar 19, 2026	—Unverified	0
SAVeS: Steering Safety Judgments in Vision-Language Models via Semantic Cues	Mar 19, 2026	—Unverified	0
Hardness of High-Dimensional Linear Classification	Mar 19, 2026	—Unverified	0
Act While Thinking: Accelerating LLM Agents via Pattern-Aware Speculative Tool Execution	Mar 19, 2026	—Unverified	0
From Accuracy to Readiness: Metrics and Benchmarks for Human-AI Decision-Making	Mar 19, 2026	—Unverified	0
AgentDS Technical Report: Benchmarking the Future of Human-AI Collaboration in Domain-Specific Data Science	Mar 19, 2026	—Unverified	0