The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6701–6750 of 661570 papers

Title	Date	Status
Causal Cellular Context Transfer Learning (C3TL): An Efficient Architecture for Prediction of Unseen Perturbation Effects	Mar 13, 2026	—Unverified
Reference-Free Image Quality Assessment for Virtual Try-On via Human Feedback	Mar 13, 2026	—Unverified
GeoChemAD: Benchmarking Unsupervised Geochemical Anomaly Detection for Mineral Exploration	Mar 13, 2026	—Unverified
Rooftop Wind Field Reconstruction Using Sparse Sensors: From Deterministic to Generative Learning Methods	Mar 13, 2026	—Unverified
Human-in-the-Loop LLM Grading for Handwritten Mathematics Assessments	Mar 13, 2026	—Unverified
Reasoning over Video: Evaluating How MLLMs Extract, Integrate, and Reconstruct Spatiotemporal Evidence	Mar 13, 2026	—Unverified
ZO-SAM: Zero-Order Sharpness-Aware Minimization for Efficient Sparse Training	Mar 13, 2026	—Unverified
XQC: Well-conditioned Optimization Accelerates Deep Reinforcement Learning	Mar 13, 2026	—Unverified
Explainable Visual Anomaly Detection via Concept Bottleneck Models	Mar 13, 2026	—Unverified
Entropy Collapse: A Universal Failure Mode of Intelligent Systems	Mar 13, 2026	—Unverified
LLM Novice Uplift on Dual-Use, In Silico Biology Tasks	Mar 13, 2026	—Unverified
Scaling Reward Modeling without Human Supervision	Mar 13, 2026	—Unverified
Dynamic Sparse Attention: Access Patterns and Architecture	Mar 13, 2026	—Unverified
Spatially Grounded Long-Horizon Task Planning in the Wild	Mar 13, 2026	—Unverified
Vision-Language Based Expert Reporting for Painting Authentication and Defect Detection	Mar 13, 2026	—Unverified
Filtered Spectral Projection for Quantum Principal Component Analysis	Mar 13, 2026	—Unverified
MESD: Detecting and Mitigating Procedural Bias in Intersectional Groups	Mar 13, 2026	—Unverified
Probabilistic Gaussian Homotopy: A Probability-Space Continuation Framework for Nonconvex Optimization	Mar 13, 2026	—Unverified
Performance evaluation of deep learning models for image analysis: considerations for visual control and statistical metrics	Mar 13, 2026	—Unverified
Analytical Logit Scaling for High-Resolution Sea Ice Topology Retrieval from Weakly Labeled SAR Imagery	Mar 13, 2026	—Unverified
A Causal Framework for Mitigating Data Shifts in Healthcare	Mar 13, 2026	—Unverified
StatePlane: A Cognitive State Plane for Long-Horizon AI Systems Under Bounded Context	Mar 13, 2026	—Unverified
Proof-Carrying Materials: Falsifiable Safety Certificates for Machine-Learned Interatomic Potentials	Mar 13, 2026	—Unverified
Design and evaluation of an agentic workflow for crisis-related synthetic tweet datasets	Mar 13, 2026	—Unverified
SldprtNet: A Large-Scale Multimodal Dataset for CAD Generation in Language-Driven 3D Design	Mar 13, 2026	—Unverified
Improving Channel Estimation via Multimodal Diffusion Models with Flow Matching	Mar 13, 2026	—Unverified
Active Sampling Sample-based Quantum Diagonalization from Finite-Shot Measurements	Mar 13, 2026	—Unverified
The AI Fiction Paradox	Mar 13, 2026	—Unverified
Ghosts of Softmax: Complex Singularities That Limit Safe Step Sizes in Cross-Entropy	Mar 13, 2026	—Unverified
VoXtream2: Full-stream TTS with dynamic speaking rate control	Mar 13, 2026	—Unverified
Learnability and Privacy Vulnerability are Entangled in a Few Critical Weights	Mar 13, 2026	—Unverified
LADR: Locality-Aware Dynamic Rescue for Efficient Text-to-Image Generation with Diffusion Large Language Models	Mar 13, 2026	—Unverified
A Grid-Based Framework for E-Scooter Demand Representation and Temporal Input Design for Deep Learning: Evidence from Austin, Texas	Mar 13, 2026	—Unverified
Topo-R1: Detecting Topological Anomalies via Vision-Language Models	Mar 13, 2026	—Unverified
LLM Routing as Reasoning: A MaxSAT View	Mar 13, 2026	—Unverified
PLUME: Building a Network-Native Foundation Model for Wireless Traces via Protocol-Aware Tokenization	Mar 13, 2026	—Unverified
Learning to Repair Lean Proofs from Compiler Feedback	Mar 13, 2026	—Unverified
InterEdit: Navigating Text-Guided Multi-Human 3D Motion Editing	Mar 13, 2026	CodeCode Available
Panoramic Multimodal Semantic Occupancy Prediction for Quadruped Robots	Mar 13, 2026	CodeCode Available
Representation Learning for Spatiotemporal Physical Systems	Mar 13, 2026	CodeCode Available
LOSC: LiDAR Open-voc Segmentation Consolidator	Mar 13, 2026	CodeCode Available
Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs	Mar 13, 2026	CodeCode Available
CHIMERA-Bench: A Benchmark Dataset for Epitope-Specific Antibody Design	Mar 13, 2026	CodeCode Available
Reconciling In-Context and In-Weight Learning via Dual Representation Space Encoding	Mar 13, 2026	CodeCode Available
DiveUp: Learning Feature Upsampling from Diverse Vision Foundation Models	Mar 13, 2026	CodeCode Available
OpenACMv2: An Accuracy-Constrained Co-Optimization Framework for Approximate DCiM	Mar 13, 2026	CodeCode Available
NOIR: Neural Operator mapping for Implicit Representations	Mar 13, 2026	CodeCode Available
EvoLMM: Self-Evolving Large Multimodal Models with Continuous Rewards	Mar 13, 2026	CodeCode Available
Steer Away From Mode Collisions: Improving Composition In Diffusion Models	Mar 13, 2026	CodeCode Available
Resolving Interference (RI): Disentangling Models for Improved Model Merging	Mar 13, 2026	CodeCode Available