The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11901–11950 of 661570 papers

Title	Date	Status	Hype
VIRGi: View-dependent Instant Recoloring of 3D Gaussians Splats	Mar 3, 2026	—Unverified	0
MaBERT:A Padding Safe Interleaved Transformer Mamba Hybrid Encoder for Efficient Extended Context Masked Language Modeling	Mar 3, 2026	—Unverified	0
SpatialText: A Pure-Text Cognitive Benchmark for Spatial Understanding in Large Language Models	Mar 3, 2026	—Unverified	0
Breaking the Prototype Bias Loop: Confidence-Aware Federated Contrastive Learning for Highly Imbalanced Clients	Mar 3, 2026	—Unverified	0
Safe and Robust Domains of Attraction for Discrete-Time Systems: A Set-Based Characterization and Certifiable Neural Network Estimation	Mar 3, 2026	—Unverified	0
REGAL: A Registry-Driven Architecture for Deterministic Grounding of Agentic AI in Enterprise Telemetry	Mar 3, 2026	—Unverified	0
SEHFS: Structural Entropy-Guided High-Order Correlation Learning for Multi-View Multi-Label Feature Selection	Mar 3, 2026	—Unverified	0
TrustMH-Bench: A Comprehensive Benchmark for Evaluating the Trustworthiness of Large Language Models in Mental Health	Mar 3, 2026	—Unverified	0
Step-Level Sparse Autoencoder for Reasoning Process Interpretation	Mar 3, 2026	CodeCode Available	0
EduVQA: Benchmarking AI-Generated Video Quality Assessment for Education	Mar 3, 2026	—Unverified	0
Using Learning Progressions to Guide AI Feedback for Science Learning	Mar 3, 2026	—Unverified	0
From Reachability to Learnability: Geometric Design Principles for Quantum Neural Networks	Mar 3, 2026	—Unverified	0
TikZilla: Scaling Text-to-TikZ with High-Quality Data and Reinforcement Learning	Mar 3, 2026	—Unverified	0
TinyIceNet: Low-Power SAR Sea Ice Segmentation for On-Board FPGA Inference	Mar 3, 2026	—Unverified	0
RAPO: Expanding Exploration for LLM Agents via Retrieval-Augmented Policy Optimization	Mar 3, 2026	—Unverified	0
TAO-Attack: Toward Advanced Optimization-Based Jailbreak Attacks for Large Language Models	Mar 3, 2026	—Unverified	0
Proactive Guiding Strategy for Item-side Fairness in Interactive Recommendation	Mar 3, 2026	—Unverified	0
Odin: Multi-Signal Graph Intelligence for Autonomous Discovery in Knowledge Graphs	Mar 3, 2026	—Unverified	0
Multi-Scale Adaptive Neighborhood Awareness Transformer For Graph Fraud Detection	Mar 3, 2026	—Unverified	0
Evaluating Performance Drift from Model Switching in Multi-Turn LLM Systems	Mar 3, 2026	—Unverified	0
Beyond Task Completion: Revealing Corrupt Success in LLM Agents through Procedure-Aware Evaluation	Mar 3, 2026	—Unverified	0
AI Space Physics: Constitutive boundary semantics for open AI institutions	Mar 3, 2026	—Unverified	0
Torus embeddings	Mar 3, 2026	—Unverified	0
Channel-Adaptive Edge AI: Maximizing Inference Throughput by Adapting Computational Complexity to Channel States	Mar 3, 2026	—Unverified	0
FEAST: Retrieval-Augmented Multi-Hierarchical Food Classification for the FoodEx2 System	Mar 3, 2026	—Unverified	0
Kling-MotionControl Technical Report	Mar 3, 2026	—Unverified	0
Conditioned Activation Transport for T2I Safety Steering	Mar 3, 2026	—Unverified	0
Less Noise, Same Certificate: Retain Sensitivity for Unlearning	Mar 3, 2026	—Unverified	0
Saarthi for AGI: Towards Domain-Specific General Intelligence for Formal Verification	Mar 3, 2026	—Unverified	0
Type-Aware Retrieval-Augmented Generation with Dependency Closure for Solver-Executable Industrial Optimization Modeling	Mar 3, 2026	—Unverified	0
Scalable Uncertainty Quantification for Black-Box Density-Based Clustering	Mar 3, 2026	—Unverified	0
MoD-DPO: Towards Mitigating Cross-modal Hallucinations in Omni LLMs using Modality Decoupled Preference Optimization	Mar 3, 2026	—Unverified	0
BeyondSWE: Can Current Code Agent Survive Beyond Single-Repo Bug Fixing?	Mar 3, 2026	—Unverified	1
Learning When to Act or Refuse: Guarding Agentic Reasoning Models for Safe Multi-Step Tool Use	Mar 3, 2026	—Unverified	0
Understanding and Mitigating Dataset Corruption in LLM Steering	Mar 3, 2026	—Unverified	0
I-CAM-UV: Integrating Causal Graphs over Non-Identical Variable Sets Using Causal Additive Models with Unobserved Variables	Mar 3, 2026	—Unverified	0
Shape Derivative-Informed Neural Operators with Application to Risk-Averse Shape Optimization	Mar 3, 2026	—Unverified	0
NeuroSkill(tm): Proactive Real-Time Agentic System Capable of Modeling Human State of Mind	Mar 3, 2026	—Unverified	0
Stabilized Adaptive Loss and Residual-Based Collocation for Physics-Informed Neural Networks	Mar 3, 2026	—Unverified	0
Adaptive Methods Are Preferable in High Privacy Settings: An SDE Perspective	Mar 3, 2026	—Unverified	0
Coalgebras for categorical deep learning: Representability and universal approximation	Mar 3, 2026	—Unverified	0
SynthCharge: An Electric Vehicle Routing Instance Generator with Feasibility Screening to Enable Learning-Based Optimization and Benchmarking	Mar 3, 2026	—Unverified	0
AI-for-Science Low-code Platform with Bayesian Adversarial Multi-Agent Framework	Mar 3, 2026	—Unverified	0
Guiding Sparse Neural Networks with Neurobiological Principles to Elicit Biologically Plausible Representations	Mar 3, 2026	—Unverified	0
Speculative Speculative Decoding	Mar 3, 2026	—Unverified	0
COP-GEN: Latent Diffusion Transformer for Copernicus Earth Observation Data -- Generation Stochastic by Design	Mar 3, 2026	—Unverified	0
Physics-informed post-processing of stabilized finite element solutions for transient convection-dominated problems	Mar 3, 2026	—Unverified	0
DuoMo: Dual Motion Diffusion for World-Space Human Reconstruction	Mar 3, 2026	—Unverified	0
Gravity Falls: A Comparative Analysis of Domain-Generation Algorithm (DGA) Detection Methods for Mobile Device Spearphishing	Mar 3, 2026	—Unverified	0
Beyond Language Modeling: An Exploration of Multimodal Pretraining	Mar 3, 2026	—Unverified	0