The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6101–6125 of 661570 papers

Title	Date	Status	Hype
Zoom to Essence: Trainless GUI Grounding by Inferring upon Interface Elements	Mar 15, 2026	—Unverified	0
Right for the Wrong Reasons: Epistemic Regret Minimization for Causal Rung Collapse in LLMs	Mar 15, 2026	—Unverified	0
PaCo-RL: Advancing Reinforcement Learning for Consistent Image Generation with Pairwise Reward Modeling	Mar 15, 2026	—Unverified	1
Nemotron-CrossThink: Scaling Self-Learning beyond Math Reasoning	Mar 15, 2026	—Unverified	0
Autonomous Agents Coordinating Distributed Discovery Through Emergent Artifact Exchange	Mar 15, 2026	—Unverified	2
Rigorous Asymptotics for First-Order Algorithms Through the Dynamical Cavity Method	Mar 15, 2026	—Unverified	0
Emotional Cost Functions for AI Safety: Teaching Agents to Feel the Weight of Irreversible Consequences	Mar 15, 2026	—Unverified	0
Stop Before You Fail: Operational Capability Boundaries for Mitigating Unproductive Reasoning in Large Reasoning Models	Mar 15, 2026	—Unverified	0
Delightful Policy Gradient	Mar 15, 2026	—Unverified	0
Precedence-Constrained Decision Trees and Coverings	Mar 15, 2026	—Unverified	0
SPARQ: Spiking Early-Exit Neural Networks for Energy-Efficient Edge AI	Mar 15, 2026	—Unverified	0
The Active Discoverer Framework: Towards Autonomous Physics Reasoning through Neuro-Symbolic LaTeX Synthesis	Mar 15, 2026	—Unverified	0
LLM-Augmented Release Intelligence: Automated Change Summarization and Impact Analysis in Cloud-Native CI/CD Pipelines	Mar 15, 2026	—Unverified	0
Fine-tuning MLLMs Without Forgetting Is Easier Than You Think	Mar 15, 2026	—Unverified	0
D-MEM: Dopamine-Gated Agentic Memory via Reward Prediction Error Routing	Mar 15, 2026	—Unverified	0
Automatic Inter-document Multi-hop Scientific QA Generation	Mar 15, 2026	—Unverified	0
Why Inference in Large Models Becomes Decomposable After Training	Mar 15, 2026	—Unverified	0
Learning Unmasking Policies for Diffusion Language Models	Mar 15, 2026	—Unverified	0
MistExit: Learning to Exit for Early Mistake Detection in Procedural Videos	Mar 15, 2026	—Unverified	0
Personalized Cell Segmentation: Benchmark and Framework for Reference-Guided Cell Type Segmentation	Mar 15, 2026	—Unverified	0
Distributional Semantics Tracing: A Framework for Explaining Hallucinations in Large Language Models	Mar 15, 2026	—Unverified	0
Central Dogma Transformer II: An AI Microscope for Understanding Cellular Regulatory Mechanisms	Mar 15, 2026	—Unverified	0
ZOTTA: Test-Time Adaptation with Gradient-Free Zeroth-Order Optimization	Mar 15, 2026	—Unverified	0
Bringing Model Editing to Generative Recommendation in Cold-Start Scenarios	Mar 15, 2026	—Unverified	0
Multilingual TinyStories: A Synthetic Combinatorial Corpus of Indic Children's Stories for Training Small Language Models	Mar 15, 2026	—Unverified	0