The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6101–6150 of 661570 papers

Title	Date	Status	Hype
Zoom to Essence: Trainless GUI Grounding by Inferring upon Interface Elements	Mar 15, 2026	—Unverified	0
Right for the Wrong Reasons: Epistemic Regret Minimization for Causal Rung Collapse in LLMs	Mar 15, 2026	—Unverified	0
PaCo-RL: Advancing Reinforcement Learning for Consistent Image Generation with Pairwise Reward Modeling	Mar 15, 2026	—Unverified	1
Nemotron-CrossThink: Scaling Self-Learning beyond Math Reasoning	Mar 15, 2026	—Unverified	0
Autonomous Agents Coordinating Distributed Discovery Through Emergent Artifact Exchange	Mar 15, 2026	—Unverified	2
Rigorous Asymptotics for First-Order Algorithms Through the Dynamical Cavity Method	Mar 15, 2026	—Unverified	0
Emotional Cost Functions for AI Safety: Teaching Agents to Feel the Weight of Irreversible Consequences	Mar 15, 2026	—Unverified	0
Stop Before You Fail: Operational Capability Boundaries for Mitigating Unproductive Reasoning in Large Reasoning Models	Mar 15, 2026	—Unverified	0
Delightful Policy Gradient	Mar 15, 2026	—Unverified	0
Precedence-Constrained Decision Trees and Coverings	Mar 15, 2026	—Unverified	0
SPARQ: Spiking Early-Exit Neural Networks for Energy-Efficient Edge AI	Mar 15, 2026	—Unverified	0
The Active Discoverer Framework: Towards Autonomous Physics Reasoning through Neuro-Symbolic LaTeX Synthesis	Mar 15, 2026	—Unverified	0
LLM-Augmented Release Intelligence: Automated Change Summarization and Impact Analysis in Cloud-Native CI/CD Pipelines	Mar 15, 2026	—Unverified	0
Fine-tuning MLLMs Without Forgetting Is Easier Than You Think	Mar 15, 2026	—Unverified	0
D-MEM: Dopamine-Gated Agentic Memory via Reward Prediction Error Routing	Mar 15, 2026	—Unverified	0
Automatic Inter-document Multi-hop Scientific QA Generation	Mar 15, 2026	—Unverified	0
Why Inference in Large Models Becomes Decomposable After Training	Mar 15, 2026	—Unverified	0
Learning Unmasking Policies for Diffusion Language Models	Mar 15, 2026	—Unverified	0
MistExit: Learning to Exit for Early Mistake Detection in Procedural Videos	Mar 15, 2026	—Unverified	0
Personalized Cell Segmentation: Benchmark and Framework for Reference-Guided Cell Type Segmentation	Mar 15, 2026	—Unverified	0
Distributional Semantics Tracing: A Framework for Explaining Hallucinations in Large Language Models	Mar 15, 2026	—Unverified	0
Central Dogma Transformer II: An AI Microscope for Understanding Cellular Regulatory Mechanisms	Mar 15, 2026	—Unverified	0
ZOTTA: Test-Time Adaptation with Gradient-Free Zeroth-Order Optimization	Mar 15, 2026	—Unverified	0
Bringing Model Editing to Generative Recommendation in Cold-Start Scenarios	Mar 15, 2026	—Unverified	0
Multilingual TinyStories: A Synthetic Combinatorial Corpus of Indic Children's Stories for Training Small Language Models	Mar 15, 2026	—Unverified	0
CausalEvolve: Towards Open-Ended Discovery with Causal Scratchpad	Mar 15, 2026	—Unverified	0
GroundSet: A Cadastral-Grounded Dataset for Spatial Understanding with Vector Data	Mar 15, 2026	—Unverified	0
Unveiling the Basin-Like Loss Landscape in Large Language Models	Mar 15, 2026	—Unverified	0
Towards Operational Automated Greenhouse Gas Plume Detection and Delineation	Mar 15, 2026	—Unverified	0
Efficient Neural Combinatorial Optimization Solver for the Min-max Heterogeneous Capacitated Vehicle Routing Problem	Mar 15, 2026	—Unverified	0
Eva-VLA: Evaluating Vision-Language-Action Models' Robustness Under Real-World Physical Variations	Mar 15, 2026	—Unverified	0
ExoPredicator: Learning Abstract Models of Dynamic Worlds for Robot Planning	Mar 15, 2026	—Unverified	0
Protecting Deep Neural Network Intellectual Property with Chaos-Based White-Box Watermarking	Mar 15, 2026	—Unverified	0
HGAN-SDEs: Learning Neural Stochastic Differential Equations with Hermite-Guided Adversarial Training	Mar 15, 2026	—Unverified	0
PolyFrame at MWE-2026 AdMIRe 2: When Words Are Not Enough: Multimodal Idiom Disambiguation	Mar 15, 2026	—Unverified	0
Implementation of Quantum Implicit Neural Representation in Deterministic and Probabilistic Autoencoders for Image Reconstruction/Generation Tasks	Mar 15, 2026	—Unverified	0
QAQ: Bidirectional Semantic Coherence for Selecting High-Quality Synthetic Code Instructions	Mar 15, 2026	—Unverified	0
Separable neural architectures as a primitive for unified predictive and generative intelligence	Mar 15, 2026	—Unverified	0
Walking Further: Semantic-aware Multimodal Gait Recognition Under Long-Range Conditions	Mar 15, 2026	—Unverified	0
Safety-Potential Pruning for Enhancing Safety Prompts Against VLM Jailbreaking Without Retraining	Mar 15, 2026	—Unverified	0
S2GS: Streaming Semantic Gaussian Splatting for Online Scene Understanding and Reconstruction	Mar 15, 2026	—Unverified	0
Windowed Fourier Propagator: A Frequency-Local Neural Operator for Wave Equations in Inhomogeneous Media	Mar 15, 2026	—Unverified	0
Toward Clinically Ready Foundation Models in Medical Image Analysis: Adaptation Mechanisms and Deployment Trade-offs	Mar 15, 2026	—Unverified	0
Multi-Period Texture Contrast Enhancement for Low-Contrast Wafer Defect Detection and Segmentation	Mar 15, 2026	—Unverified	0
MorphSNN: Adaptive Graph Diffusion and Structural Plasticity for Spiking Neural Networks	Mar 15, 2026	—Unverified	0
Label Noise Cleaning for Supervised Classification via Bernoulli Random Sampling	Mar 15, 2026	—Unverified	0
Generation of Human Comprehensible Access Control Policies from Audit Logs	Mar 15, 2026	—Unverified	0
OxyGen: Unified KV Cache Management for Vision-Language-Action Models under Multi-Task Parallelism	Mar 15, 2026	—Unverified	0
OCRA: Object-Centric Learning with 3D and Tactile Priors for Human-to-Robot Action Transfer	Mar 15, 2026	—Unverified	0
Graph-Based Deep Learning for Intelligent Detection of Energy Losses, Theft, and Operational Inefficiencies in Oil & Gas Production Networks	Mar 15, 2026	—Unverified	0