The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9151–9200 of 661570 papers

Title	Date	Status
APPLV: Adaptive Planner Parameter Learning from Vision-Language-Action Model	Mar 9, 2026	—Unverified
Why Channel-Centric Models are not Enough to Predict End-to-End Performance in Private 5G: A Measurement Campaign and Case Study	Mar 9, 2026	—Unverified
Towards Visual Query Segmentation in the Wild	Mar 9, 2026	—Unverified
Multi-Kernel Gated Decoder Adapters for Robust Multi-Task Thyroid Ultrasound under Cross-Center Shift	Mar 9, 2026	—Unverified
Cross-Domain Uncertainty Quantification for Selective Prediction: A Comprehensive Bound Ablation with Transfer-Informed Betting	Mar 9, 2026	—Unverified
FedLECC: Cluster- and Loss-Guided Client Selection for Federated Learning under Non-IID Data	Mar 9, 2026	—Unverified
Quantifying Memorization and Privacy Risks in Genomic Language Models	Mar 9, 2026	—Unverified
Uncovering a Winning Lottery Ticket with Continuously Relaxed Bernoulli Gates	Mar 9, 2026	—Unverified
Vision-Language Models Encode Clinical Guidelines for Concept-Based Medical Reasoning	Mar 9, 2026	—Unverified
Quantifying Uncertainty in AI Visibility: A Statistical Framework for Generative Search Measurement	Mar 9, 2026	—Unverified
MEGC2026: Micro-Expression Grand Challenge on Visual Question Answering	Mar 9, 2026	—Unverified
Using Vision Language Foundation Models to Generate Plant Simulation Configurations via In-Context Learning	Mar 9, 2026	—Unverified
Optimizing Reinforcement Learning Training over Digital Twin Enabled Multi-fidelity Networks	Mar 9, 2026	—Unverified
Interpretable Markov-Based Spatiotemporal Risk Surfaces for Missing-Child Search Planning with Reinforcement Learning and LLM-Based Quality Assurance	Mar 9, 2026	—Unverified
Kernel Debiased Plug-in Estimation based on the Universal Least Favorable Submodel	Mar 9, 2026	—Unverified
The qs Inequality: Quantifying the Double Penalty of Mixture-of-Experts at Inference	Mar 9, 2026	—Unverified
Semantic Level of Detail: Multi-Scale Knowledge Representation via Heat Kernel Diffusion on Hyperbolic Manifolds	Mar 9, 2026	—Unverified
Can You Hear, Localize, and Segment Continually? An Exemplar-Free Continual Learning Benchmark for Audio-Visual Segmentation	Mar 9, 2026	—Unverified
MAcPNN: Mutual Assisted Learning on Data Streams with Temporal Dependence	Mar 9, 2026	—Unverified
Data-driven robust Markov decision processes on Borel spaces: performance guarantees via an axiomatic approach	Mar 9, 2026	—Unverified
SVG-EAR: Parameter-Free Linear Compensation for Sparse Video Generation via Error-aware Routing	Mar 9, 2026	—Unverified
SurgCalib: Gaussian Splatting-Based Hand-Eye Calibration for Robot-Assisted Minimally Invasive Surgery	Mar 9, 2026	—Unverified
MAPLE: Elevating Medical Reasoning from Statistical Consensus to Process-Led Alignment	Mar 9, 2026	—Unverified
Diffusion-Based Authentication of Copy Detection Patterns: A Multimodal Framework with Printer Signature Conditioning	Mar 9, 2026	—Unverified
Security Considerations for Multi-agent Systems	Mar 9, 2026	—Unverified
Gender Fairness in Audio Deepfake Detection: Performance and Disparity Analysis	Mar 9, 2026	—Unverified
Statistical Inference via Generative Models: Flow Matching and Causal Inference	Mar 9, 2026	—Unverified
Improving through Interaction: Searching Behavioral Representation Spaces with CMA-ES-IG	Mar 9, 2026	CodeCode Available
An accurate flatness measure to estimate the generalization performance of CNN models	Mar 9, 2026	—Unverified
Automating Detection and Root-Cause Analysis of Flaky Tests in Quantum Software	Mar 9, 2026	—Unverified
AI Phenomenology for Understanding Human-AI Experiences Across Eras	Mar 9, 2026	—Unverified
The Missing Memory Hierarchy: Demand Paging for LLM Context Windows	Mar 9, 2026	—Unverified
When to Retrain after Drift: A Data-Only Test of Post-Drift Data Size Sufficiency	Mar 9, 2026	—Unverified
CORE-Acu: Structured Reasoning Traces and Knowledge Graph Safety Verification for Acupuncture Clinical Decision Support	Mar 9, 2026	—Unverified
Small Language Models for Efficient Agentic Tool Calling: Outperforming Large Models with Targeted Fine-tuning	Mar 9, 2026	—Unverified
MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks	Mar 9, 2026	—Unverified
Visual Self-Fulfilling Alignment: Shaping Safety-Oriented Personas via Threat-Related Images	Mar 9, 2026	—Unverified
Understand Then Memory: A Cognitive Gist-Driven RAG Framework with Global Semantic Diffusion	Mar 9, 2026	—Unverified
Visualizing Coalition Formation: From Hedonic Games to Image Segmentation	Mar 9, 2026	—Unverified
A Dataset for Probing Translationese Preferences in English-to-Swedish Translation	Mar 9, 2026	—Unverified
Divide and Predict: An Architecture for Input Space Partitioning and Enhanced Accuracy	Mar 9, 2026	—Unverified
Convergence Rate for the Last Iterate of Stochastic Gradient Descent Schemes	Mar 9, 2026	—Unverified
Aero-Promptness: Drag-Aware Aerodynamic Manipulability for Propeller-driven Vehicles	Mar 9, 2026	—Unverified
Examining the Role of YouTube Production and Consumption Dynamics on the Formation of Extreme Ideologies	Mar 9, 2026	—Unverified
SRNeRV: A Scale-wise Recursive Framework for Neural Video Representation	Mar 9, 2026	—Unverified
Disentangling Reasoning in Large Audio-Language Models for Ambiguous Emotion Prediction	Mar 9, 2026	—Unverified
A Recipe for Stable Offline Multi-agent Reinforcement Learning	Mar 9, 2026	—Unverified
Grow, Assess, Compress: Adaptive Backbone Scaling for Memory-Efficient Class Incremental Learning	Mar 9, 2026	—Unverified
Benchmarking Language Modeling for Lossless Compression of Full-Fidelity Audio	Mar 9, 2026	—Unverified
Discovering Symbolic Differential Equations with Symmetry Invariants	Mar 9, 2026	—Unverified