The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9601–9650 of 661570 papers

Title	Date	Status	Hype
Distributionally Robust Self Paced Curriculum Reinforcement Learning	Mar 8, 2026	—Unverified	0
Beyond Data Splitting: Full-Data Conformal Prediction by Differential Privacy	Mar 8, 2026	—Unverified	0
Brain-WM: Brain Glioblastoma World Model	Mar 8, 2026	CodeCode Available	0
Accelerating Diffusion Models for Generative AI Applications with Silicon Photonics	Mar 8, 2026	—Unverified	0
Probabilistic Inference and Learning with Stein's Method	Mar 8, 2026	—Unverified	0
PointSlice: Accurate and Efficient Slice-Based Representation for 3D Object Detection from Point Clouds	Mar 8, 2026	CodeCode Available	0
Beyond Endpoints: Path-Centric Reasoning for Vectorized Off-Road Network Extraction	Mar 8, 2026	CodeCode Available	0
Extracting Recurring Vulnerabilities from Black-Box LLM-Generated Software	Mar 8, 2026	CodeCode Available	0
Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System	Mar 8, 2026	CodeCode Available	0
FedEU: Evidential Uncertainty-Driven Federated Fine-Tuning of Vision Foundation Models for Remote Sensing Image Segmentation	Mar 8, 2026	CodeCode Available	0
EVLF: Early Vision-Language Fusion for Generative Dataset Distillation	Mar 8, 2026	CodeCode Available	0
PureCC: Pure Learning for Text-to-Image Concept Customization	Mar 8, 2026	CodeCode Available	0
Revisiting the LiRA Membership Inference Attack Under Realistic Assumptions	Mar 8, 2026	CodeCode Available	0
KCoEvo: A Knowledge Graph Augmented Framework for Evolutionary Code Generation	Mar 8, 2026	CodeCode Available	0
Duala: Dual-Level Alignment of Subjects and Stimuli for Cross-Subject fMRI Decoding	Mar 8, 2026	CodeCode Available	0
3DMedAgent: Unified Perception-to-Understanding for 3D Medical Analysis	Mar 8, 2026	CodeCode Available	0
PonderLM-2: Pretraining LLM with Latent Thoughts in Continuous Space	Mar 8, 2026	CodeCode Available	0
Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents	Mar 8, 2026	CodeCode Available	0
MUGSQA: Novel Multi-Uncertainty-Based Gaussian Splatting Quality Assessment Method, Dataset, and Benchmarks	Mar 8, 2026	CodeCode Available	0
KVSlimmer: Theoretical Insights and Practical Optimizations for Asymmetric KV Merging	Mar 8, 2026	CodeCode Available	0
Backdoor4Good: Benchmarking Beneficial Uses of Backdoors in LLMs	Mar 8, 2026	CodeCode Available	0
SiamGM: Siamese Geometry-Aware and Motion-Guided Network for Real-Time Satellite Video Object Tracking	Mar 8, 2026	CodeCode Available	0
KohakuRAG: A simple RAG framework with hierarchical document indexing	Mar 8, 2026	CodeCode Available	0
NAAMSE: Framework for Evolutionary Security Evaluation of Agents	Mar 8, 2026	CodeCode Available	0
Route, Retrieve, Reflect, Repair: Self-Improving Agentic Framework for Visual Detection and Linguistic Reasoning in Medical Imaging	Mar 8, 2026	CodeCode Available	0
TAPFormer: Robust Arbitrary Point Tracking via Transient Asynchronous Fusion of Frames and Events	Mar 8, 2026	—Unverified	1
Holi-Spatial: Evolving Video Streams into Holistic 3D Spatial Intelligence	Mar 8, 2026	—Unverified	3
HiconAgent: History Context-aware Policy Optimization for GUI Agents	Mar 8, 2026	—Unverified	1
GLASS: Graph and Vision-Language Assisted Semantic Shape Correspondence	Mar 8, 2026	—Unverified	0
Generalization in Online Reinforcement Learning for Mobile Agents	Mar 8, 2026	CodeCode Available	0
Konkani LLM: Multi-Script Instruction Tuning and Evaluation for a Low-Resource Indian Language	Mar 7, 2026	—Unverified	0
Did You Forget What I Asked? Prospective Memory Failures in Large Language Models	Mar 7, 2026	—Unverified	0
Large Language Models Unpack Complex Political Opinions through Target-Stance Extraction	Mar 7, 2026	—Unverified	0
Fusing Driver Perceived and Physical Risk for Safety Critical Scenario Screening in Autonomous Driving	Mar 7, 2026	—Unverified	0
Discovering the Hidden Role of Gini Index In Prompt-based Classification	Mar 7, 2026	—Unverified	0
Beyond Reward Suppression: Reshaping Steganographic Communication Protocols in MARL via Dynamic Representational Circuit Breaking	Mar 7, 2026	—Unverified	0
Recursive Language Models Meet Uncertainty: The Surprising Effectiveness of Self-Reflective Program Search for Long Context	Mar 7, 2026	—Unverified	0
Complementarity-Supervised Spectral-Band Routing for Multimodal Emotion Recognition	Mar 7, 2026	—Unverified	0
MS2MetGAN: Latent-space adversarial training for metabolite-spectrum matching in MS/MS database search	Mar 7, 2026	—Unverified	0
Post Training Quantization for Efficient Dataset Condensation	Mar 7, 2026	—Unverified	0
AI-Driven Predictive Maintenance with Real-Time Contextual Data Fusion for Connected Vehicles: A Multi-Dataset Evaluation	Mar 7, 2026	—Unverified	0
DDS-UDA: Dual-Domain Synergy for Unsupervised Domain Adaptation in Joint Segmentation of Optic Disc and Optic Cup	Mar 7, 2026	—Unverified	0
DyACE: Dynamic Algorithm Co-evolution for Online Automated Heuristic Design with Large Language Model	Mar 7, 2026	—Unverified	0
PolyGLU: State-Conditional Activation Routing in Transformer Feed-Forward Networks	Mar 7, 2026	—Unverified	0
AutoTool: Automatic Scaling of Tool-Use Capabilities in RL via Decoupled Entropy Constraints	Mar 7, 2026	—Unverified	0
MURE: Hierarchical Multi-Resolution Encoding via Vision-Language Models for Visual Document Retrieval	Mar 7, 2026	—Unverified	0
Thermal Robustness of Retrieval in Dense Associative Memories: LSE vs LSR Kernels	Mar 7, 2026	—Unverified	0
Prompt Complexity Dilutes Structured Reasoning: A Follow-Up Study on the Car Wash Problem	Mar 7, 2026	—Unverified	0
Mind the Discriminability Trap in Source-Free Cross-domain Few-shot Learning	Mar 7, 2026	CodeCode Available	0
ConfHit: Conformal Generative Design with Oracle Free Guarantees	Mar 7, 2026	—Unverified	0