The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9251–9300 of 661570 papers

Title	Date	Status
HECTOR: Hybrid Editable Compositional Object References for Video Generation	Mar 9, 2026	—Unverified
Bayesian Transformer for Probabilistic Load Forecasting in Smart Grids	Mar 9, 2026	—Unverified
How Much Do LLMs Hallucinate in Document Q&A Scenarios? A 172-Billion-Token Study Across Temperatures, Context Lengths, and Hardware Platforms	Mar 9, 2026	—Unverified
Autoregressive Visual Decoding from EEG Signals	Mar 9, 2026	—Unverified
Revisiting Gradient Staleness: Evaluating Distance Metrics for Asynchronous Federated Learning Aggregation	Mar 9, 2026	—Unverified
OSS-CRS: Liberating AIxCC Cyber Reasoning Systems for Real-World Open-Source Security	Mar 9, 2026	—Unverified
ConflictBench: Evaluating Human-AI Conflict via Interactive and Visually Grounded Environments	Mar 9, 2026	—Unverified
A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations	Mar 9, 2026	—Unverified
Latent Sculpting for Zero-Shot Generalization: A Manifold Learning Approach to Out-of-Distribution Anomaly Detection	Mar 9, 2026	—Unverified
Semantic Risk Scoring of Aggregated Metrics: An AI-Driven Approach for Healthcare Data Governance	Mar 9, 2026	—Unverified
MERLIN: Building Low-SNR Robust Multimodal LLMs for Electromagnetic Signals	Mar 9, 2026	—Unverified
Beyond Attention Heatmaps: How to Get Better Explanations for Multiple Instance Learning Models in Histopathology	Mar 9, 2026	CodeCode Available
The FABRIC Strategy for Verifying Neural Feedback Systems	Mar 9, 2026	—Unverified
Are vision-language models ready to zero-shot replace supervised classification models in agriculture?	Mar 9, 2026	—Unverified
Context-free Self-Conditioned GAN for Trajectory Forecasting	Mar 9, 2026	—Unverified
Double projection for reconstructing dynamical systems: between stochastic and deterministic regimes	Mar 9, 2026	—Unverified
CauKer: Classification Time Series Foundation Models Can Be Pretrained on Synthetic Data	Mar 9, 2026	CodeCode Available
The Ends Justify the Thoughts: RL-Induced Motivated Reasoning in LLM CoTs	Mar 9, 2026	CodeCode Available
ORIC: Benchmarking Object Recognition under Contextual Incongruity in Large Vision-Language Models	Mar 9, 2026	CodeCode Available
ODI-Bench: Can MLLMs Understand Immersive Omnidirectional Environments?	Mar 9, 2026	CodeCode Available
HypoSpace: Evaluating LLM Creativity as Set-Valued Hypothesis Generators under Underdetermination	Mar 9, 2026	CodeCode Available
CryoNet.Refine: A One-step Diffusion Model for Rapid Refinement of Structural Models with Cryo-EM Density Map Restraints	Mar 9, 2026	CodeCode Available
SCOPE: Scene-Contextualized Incremental Few-Shot 3D Segmentation	Mar 9, 2026	CodeCode Available
SynPlanResearch-R1: Encouraging Tool Exploration for Deep Research with Synthetic Plans	Mar 9, 2026	CodeCode Available
Geometric Transformation-Embedded Mamba for Learned Video Compression	Mar 9, 2026	CodeCode Available
Enhancing Unregistered Hyperspectral Image Super-Resolution via Unmixing-based Abundance Fusion Learning	Mar 9, 2026	CodeCode Available
VisualAD: Language-Free Zero-Shot Anomaly Detection via Vision Transformer	Mar 9, 2026	CodeCode Available
Missing No More: Dictionary-Guided Cross-Modal Image Fusion under Missing Infrared	Mar 9, 2026	CodeCode Available
TALON: Test-time Adaptive Learning for On-the-Fly Category Discovery	Mar 9, 2026	CodeCode Available
Training event-based neural networks with exact gradients via Differentiable ODE Solving in JAX	Mar 9, 2026	CodeCode Available
LAMUS: A Large-Scale Corpus for Legal Argument Mining from U.S. Caselaw using LLMs	Mar 9, 2026	CodeCode Available
Local-Global Prompt Learning via Sparse Optimal Transport	Mar 9, 2026	CodeCode Available
Echo2ECG: Enhancing ECG Representations with Cardiac Morphology from Multi-View Echos	Mar 9, 2026	CodeCode Available
OccTrack360: 4D Panoptic Occupancy Tracking from Surround-View Fisheye Cameras	Mar 9, 2026	CodeCode Available
Computational Multi-Agents Society Experiments: Social Modeling Framework Based on Generative Agents	Mar 9, 2026	CodeCode Available
Test-Driven AI Agent Definition (TDAD): Compiling Tool-Using Agents from Behavioral Specifications	Mar 9, 2026	CodeCode Available
Meissa: Multi-modal Medical Agentic Intelligence	Mar 9, 2026	CodeCode Available
LEL: Lipschitz Continuity Constrained Ensemble Learning for Efficient EEG-Based Intra-subject Emotion Recognition	Mar 9, 2026	CodeCode Available
Exposing the Illusion of Fairness: Auditing Vulnerabilities to Distributional Manipulation Attacks	Mar 9, 2026	CodeCode Available
Unified and Semantically Grounded Domain Adaptation for Medical Image Segmentation	Mar 9, 2026	CodeCode Available
MICA: Multi-Agent Industrial Coordination Assistant	Mar 9, 2026	CodeCode Available
Mapping Overlaps in Benchmarks through Perplexity in the Wild	Mar 9, 2026	CodeCode Available
CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation	Mar 9, 2026	CodeCode Available
HACHIMI: Scalable and Controllable Student Persona Generation via Orchestrated Agents	Mar 9, 2026	CodeCode Available
TumorChain: Interleaved Multimodal Chain-of-Thought Reasoning for Traceable Clinical Tumor Analysis	Mar 9, 2026	CodeCode Available
ELLMob: Event-Driven Human Mobility Generation with Self-Aligned LLM Framework	Mar 9, 2026	CodeCode Available
SmartThinker: Progressive Chain-of-Thought Length Calibration for Efficient Large Language Model Reasoning	Mar 9, 2026	CodeCode Available
High-Fidelity Pruning for Large Language Models	Mar 9, 2026	CodeCode Available
Adaptive MLP Pruning for Large Vision Transformers	Mar 9, 2026	CodeCode Available
Model-based Offline RL via Robust Value-Aware Model Learning with Implicitly Differentiable Adaptive Weighting	Mar 9, 2026	CodeCode Available