The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2701–2750 of 659983 papers

Title	Date	Status
A Contextual Help Browser Extension to Assist Digital Illiterate Internet Users	Mar 18, 2026	—Unverified
FailureMem: A Failure-Aware Multimodal Framework for Autonomous Software Repair	Mar 18, 2026	—Unverified
Trust the Unreliability: Inward Backward Dynamic Unreliability Driven Coreset Selection for Medical Image Classification	Mar 18, 2026	—Unverified
End-to-end data-driven prediction of urban airflow and pollutant dispersion	Mar 18, 2026	—Unverified
VeriAgent: A Tool-Integrated Multi-Agent System with Evolving Memory for PPA-Aware RTL Code Generation	Mar 18, 2026	—Unverified
Temporal Narrative Monitoring in Dynamic Information Environments	Mar 18, 2026	—Unverified
Do Language Models Encode Semantic Relations? Probing and Sparse Feature Analysis	Mar 18, 2026	—Unverified
A Multi-Agent System for Building-Age Cohort Mapping to Support Urban Energy Planning	Mar 18, 2026	—Unverified
Atomic Trajectory Modeling with State Space Models for Biomolecular Dynamics	Mar 18, 2026	—Unverified
DSS-GAN: Directional State Space GAN with Mamba backbone for Class-Conditional Image Synthesis	Mar 18, 2026	—Unverified
Towards Infinitely Long Neural Simulations: Self-Refining Neural Surrogate Models for Dynamical Systems	Mar 18, 2026	—Unverified
VeriGrey: Greybox Agent Validation	Mar 18, 2026	—Unverified
Interpretable Cross-Domain Few-Shot Learning with Rectified Target-Domain Local Alignment	Mar 18, 2026	—Unverified
Few-Step Diffusion Sampling Through Instance-Aware Discretizations	Mar 18, 2026	—Unverified
Post-Training Local LLM Agents for Linux Privilege Escalation with Verifiable Rewards	Mar 18, 2026	—Unverified
Illumination-Aware Contactless Fingerprint Spoof Detection via Paired Flash-Non-Flash Imaging	Mar 18, 2026	—Unverified
WeatherReasonSeg: A Benchmark for Weather-Aware Reasoning Segmentation in Visual Language Models	Mar 18, 2026	—Unverified
Sensi: Learn One Thing at a Time -- Curriculum-Based Test-Time Learning for LLM Game Agents	Mar 18, 2026	—Unverified
Does YOLO Really Need to See Every Training Image in Every Epoch?	Mar 18, 2026	—Unverified
Objective Mispricing Detection for Shortlisting Undervalued Football Players via Market Dynamics and News Signals	Mar 18, 2026	—Unverified
Stochastic set-valued optimization and its application to robust learning	Mar 18, 2026	—Unverified
Learning Transferable Temporal Primitives for Video Reasoning via Synthetic Videos	Mar 18, 2026	—Unverified
Exploring parameter-efficient fine-tuning (PEFT) of billion-parameter vision models with QLoRA and DoRA: insights into generalization for limited-data image classification under a 98:1 test-to-train regime	Mar 18, 2026	—Unverified
AERR-Nav: Adaptive Exploration-Recovery-Reminiscing Strategy for Zero-Shot Object Navigation	Mar 18, 2026	—Unverified
PC-CrossDiff: Point-Cluster Dual-Level Cross-Modal Differential Attention for Unified 3D Referring and Segmentation	Mar 18, 2026	—Unverified
Evidence Packing for Cross-Domain Image Deepfake Detection with LVLMs	Mar 18, 2026	—Unverified
ResNet-50 with Class Reweighting and Anatomy-Guided Temporal Decoding for Gastrointestinal Video Analysis	Mar 18, 2026	—Unverified
Facial Movement Dynamics Reveal Workload During Complex Multitasking	Mar 18, 2026	—Unverified
CoVerRL: Breaking the Consensus Trap in Label-Free Reasoning via Generator-Verifier Co-Evolution	Mar 18, 2026	—Unverified
CrowdGaussian: Reconstructing High-Fidelity 3D Gaussians for Human Crowd from a Single Image	Mar 18, 2026	—Unverified
Facts as First Class Objects: Knowledge Objects for Persistent LLM Memory	Mar 18, 2026	—Unverified
EVA: Aligning Video World Models with Executable Robot Actions via Inverse Dynamics Rewards	Mar 18, 2026	—Unverified
Dropout Robustness and Cognitive Profiling of Transformer Models via Stochastic Inference	Mar 18, 2026	—Unverified
ChopGrad: Pixel-Wise Losses for Latent Video Diffusion via Truncated Backpropagation	Mar 18, 2026	—Unverified
Discovering Decoupled Functional Modules in Large Language Models	Mar 18, 2026	—Unverified
RPMS: Enhancing LLM-Based Embodied Planning through Rule-Augmented Memory Synergy	Mar 18, 2026	—Unverified
Symmetry-Reduced Physics-Informed Learning of Tensegrity Dynamics	Mar 18, 2026	—Unverified
Steering Video Diffusion Transformers with Massive Activations	Mar 18, 2026	—Unverified
TINA: Text-Free Inversion Attack for Unlearned Text-to-Image Diffusion Models	Mar 18, 2026	—Unverified
CodeScout: An Effective Recipe for Reinforcement Learning of Code Search Agents	Mar 18, 2026	—Unverified
Generative Control as Optimization: Time Unconditional Flow Matching for Adaptive and Robust Robotic Control	Mar 18, 2026	—Unverified
Verification and Validation of Physics-Informed Surrogate Component Models for Dynamic Power-System Simulation	Mar 18, 2026	—Unverified
The Silent Thought: Modeling Internal Cognition in Full-Duplex Spoken Dialogue Models via Latent Reasoning	Mar 18, 2026	—Unverified
How do LLMs Compute Verbal Confidence	Mar 18, 2026	—Unverified
Operator-Theoretic Foundations and Policy Gradient Methods for General MDPs with Unbounded Costs	Mar 18, 2026	—Unverified
Edit Spillover as a Probe: Do Image Editing Models Implicitly Understand World Relations?	Mar 18, 2026	—Unverified
AI-Assisted Goal Setting Improves Goal Progress Through Social Accountability	Mar 18, 2026	—Unverified
Identity as Presence: Towards Appearance and Voice Personalized Joint Audio-Video Generation	Mar 18, 2026	—Unverified
RAMP: Reinforcement Adaptive Mixed Precision Quantization for Efficient On Device LLM Inference	Mar 18, 2026	—Unverified
scicode-lint: Detecting Methodology Bugs in Scientific Python Code with LLM-Generated Patterns	Mar 18, 2026	—Unverified