The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4601–4650 of 661570 papers

Title	Date	Status
Ask don't tell: Reducing sycophancy in large language models	Mar 17, 2026	—Unverified
Fixed Anchors Are Not Enough: Dynamic Retrieval and Persistent Homology for Dataset Distillation	Mar 17, 2026	—Unverified
Transit Network Design with Two-Level Demand Uncertainties: A Machine Learning and Contextual Stochastic Optimization Framework	Mar 17, 2026	—Unverified
Is Seeing Believing? Evaluating Human Sensitivity to Synthetic Video	Mar 17, 2026	—Unverified
Model Medicine: A Clinical Framework for Understanding, Diagnosing, and Treating AI Models	Mar 17, 2026	—Unverified
Med-DualLoRA: Local Adaptation of Foundation Models for 3D Cardiac MRI	Mar 17, 2026	—Unverified
AutothinkRAG: Complexity-Aware Control of Retrieval-Augmented Reasoning for Image-Text Interaction	Mar 17, 2026	—Unverified
Test-Time Adaptation via Many-Shot Prompting: Benefits, Limits, and Pitfalls	Mar 17, 2026	—Unverified
Association of Progressive PPFE and Mortality in Lung Cancer Screening Cohorts	Mar 17, 2026	—Unverified
Measuring AI Agents' Progress on Multi-Step Cyber Attack Scenarios	Mar 17, 2026	—Unverified
Automating Skill Acquisition through Large-Scale Mining of Open-Source Agentic Repositories: A Framework for Multi-Agent Procedural Knowledge Extraction	Mar 17, 2026	—Unverified
OrigamiBench: An Interactive Environment to Synthesize Flat-Foldable Origamis	Mar 17, 2026	—Unverified
Efficient Federated Conformal Prediction with Group-Conditional Guarantees	Mar 17, 2026	—Unverified
HindSight: Evaluating LLM-Generated Research Ideas via Future Impact	Mar 17, 2026	—Unverified
V-JEPA 2.1: Unlocking Dense Features in Video Self-Supervised Learning	Mar 17, 2026	—Unverified
Unified Removal of Raindrops and Reflections: A New Benchmark and A Novel Pipeline	Mar 17, 2026	—Unverified
More Test-Time Compute Can Hurt: Overestimation Bias in LLM Beam Search	Mar 17, 2026	—Unverified
Gym-V: A Unified Vision Environment System for Agentic Vision Research	Mar 17, 2026	—Unverified
Look Before Acting: Enhancing Vision Foundation Representations for Vision-Language-Action Models	Mar 17, 2026	—Unverified
Unpaired Cross-Domain Calibration of DMSP to VIIRS Nighttime Light Data Based on CUT Network	Mar 17, 2026	—Unverified
Explainable machine learning workflows for radio astronomical data processing	Mar 17, 2026	—Unverified
Toward Experimentation-as-a-Service in 5G/6G: The Plaza6G Prototype for AI-Assisted Trials	Mar 17, 2026	—Unverified
D^3-RSMDE: 40 Faster and High-Fidelity Remote Sensing Monocular Depth Estimation	Mar 17, 2026	—Unverified
FactorEngine: A Program-level Knowledge-Infused Factor Mining Framework for Quantitative Investment	Mar 17, 2026	—Unverified
DynamicGate MLP Conditional Computation via Learned Structural Dropout and Input Dependent Gating for Functional Plasticity	Mar 17, 2026	—Unverified
Encoding Predictability and Legibility for Style-Conditioned Diffusion Policy	Mar 17, 2026	—Unverified
FederatedFactory: Generative One-Shot Learning for Extremely Non-IID Distributed Scenarios	Mar 17, 2026	—Unverified
Prior-Informed Neural Network Initialization: A Spectral Approach for Function Parameterizing Architectures	Mar 17, 2026	—Unverified
DermaFlux: Synthetic Skin Lesion Generation with Rectified Flows for Enhanced Image Classification	Mar 17, 2026	—Unverified
PlotTwist: A Creative Plot Generation Framework with Small Language Models	Mar 17, 2026	—Unverified
RECOVER: Robust Entity Correction via agentic Orchestration of hypothesis Variants for Evidence-based Recovery	Mar 17, 2026	—Unverified
Trained Persistent Memory for Frozen Encoder--Decoder LLMs: Six Architectural Methods	Mar 17, 2026	—Unverified
IndexRAG: Bridging Facts for Cross-Document Reasoning at Index Time	Mar 17, 2026	—Unverified
Via Negativa for AI Alignment: Why Negative Constraints Are Structurally Superior to Positive Preferences	Mar 17, 2026	—Unverified
SF-Mamba: Rethinking State Space Model for Vision	Mar 17, 2026	—Unverified
An approximate graph elicits detonation lattice	Mar 17, 2026	—Unverified
3D Fourier-based Global Feature Extraction for Hyperspectral Image Classification	Mar 17, 2026	—Unverified
IRIS: A Real-World Benchmark for Inverse Recovery and Identification of Physical Dynamic Systems from Monocular Video	Mar 17, 2026	—Unverified
Capability-Guided Compression: Toward Interpretability-Aware Budget Allocation for Large Language Models	Mar 17, 2026	—Unverified
Visual Distraction Undermines Moral Reasoning in Vision-Language Models	Mar 17, 2026	—Unverified
TinyGLASS: Real-Time Self-Supervised In-Sensor Anomaly Detection	Mar 17, 2026	—Unverified
RetailBench: Evaluating Long-Horizon Autonomous Decision-Making and Strategy Stability of LLM Agents in Realistic Retail Environments	Mar 17, 2026	—Unverified
Evo-Retriever: LLM-Guided Curriculum Evolution with Viewpoint-Pathway Collaboration for Multimodal Document Retrieval	Mar 17, 2026	—Unverified
DynHD: Hallucination Detection for Diffusion Large Language Models via Denoising Dynamics Deviation Learning	Mar 17, 2026	—Unverified
GAP-MLLM: Geometry-Aligned Pre-training for Activating 3D Spatial Perception in Multimodal Large Language Models	Mar 17, 2026	—Unverified
DST-Net: A Dual-Stream Transformer with Illumination-Independent Feature Guidance and Multi-Scale Spatial Convolution for Low-Light Image Enhancement	Mar 17, 2026	—Unverified
AdaMem: Adaptive User-Centric Memory for Long-Horizon Dialogue Agents	Mar 17, 2026	—Unverified
Bridging the High-Frequency Data Gap: A Millisecond-Resolution Network Dataset for Advancing Time Series Foundation Models	Mar 17, 2026	—Unverified
FEAT: A Linear-Complexity Foundation Model for Extremely Large Structured Data	Mar 17, 2026	—Unverified
Exploring different approaches to customize language models for domain-specific text-to-code generation	Mar 17, 2026	—Unverified