The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4376–4400 of 661570 papers

Title	Date	Status
Attention-guided Evidence Grounding for Spoken Question Answering	Mar 18, 2026	—Unverified
Explanations Go Linear: Post-hoc Explainability for Tabular Data with Interpretable Meta-Encoding	Mar 18, 2026	—Unverified
Hebbian Physics Networks: A Self-Organizing Computational Architecture Based on Local Physical Laws	Mar 18, 2026	—Unverified
ReviewScore: Misinformed Peer Review Detection with Large Language Models	Mar 18, 2026	—Unverified
On the identifiability of causal graphs with multiple environments	Mar 18, 2026	—Unverified
Provably Safe Model Updates	Mar 18, 2026	—Unverified
Efficient Cross-Domain Offline Reinforcement Learning with Dynamics- and Value-Aligned Data Filtering	Mar 18, 2026	—Unverified
The Moralization Corpus: Frame-Based Annotation and Analysis of Moralizing Speech Acts across Diverse Text Genres	Mar 18, 2026	—Unverified
Stepwise Think-Critique: A Unified Framework for Robust and Interpretable LLM Reasoning	Mar 18, 2026	—Unverified
Global Optimization By Gradient From Hierarchical Score-Matching Spaces	Mar 18, 2026	—Unverified
Federated Causal Representation Learning in State-Space Systems for Decentralized Counterfactual Reasoning	Mar 18, 2026	—Unverified
CogGen: Cognitive-Load-Informed Fully Unsupervised Deep Generative Modeling for Compressively Sampled MRI Reconstruction	Mar 18, 2026	—Unverified
LUMINA: LLM-Guided GPU Architecture Exploration via Bottleneck Analysis	Mar 18, 2026	—Unverified
Event-Driven Video Generation	Mar 18, 2026	—Unverified
Next-Frame Decoding for Ultra-Low-Bitrate Image Compression with Video Diffusion Priors	Mar 18, 2026	—Unverified
NV-Bench: Benchmark of Nonverbal Vocalization Synthesis for Expressive Text-to-Speech Generation	Mar 18, 2026	—Unverified
EngGPT2: Sovereign, Efficient and Open Intelligence	Mar 18, 2026	—Unverified
TRUST-SQL: Tool-Integrated Multi-Turn Reinforcement Learning for Text-to-SQL over Unknown Schemas	Mar 18, 2026	—Unverified
HGP-Mamba: Integrating Histology and Generated Protein Features for Mamba-based Multimodal Survival Risk Prediction	Mar 18, 2026	CodeCode Available
Draft-and-Prune: Improving the Reliability of Auto-formalization for Logical Reasoning	Mar 18, 2026	—Unverified
ConfusionBench: An Expert-Validated Benchmark for Confusion Recognition and Localization in Educational Videos	Mar 18, 2026	—Unverified
Directing the Narrative: A Finetuning Method for Controlling Coherence and Style in Story Generation	Mar 18, 2026	—Unverified
Embedding World Knowledge into Tabular Models: Towards Best Practices for Embedding Pipeline Design	Mar 18, 2026	—Unverified
Physics-informed offline reinforcement learning eliminates catastrophic fuel waste in maritime routing	Mar 18, 2026	—Unverified
Beyond Outliers: A Data-Free Layer-wise Mixed-Precision Quantization Approach Driven by Numerical and Structural Dual-Sensitivity	Mar 18, 2026	—Unverified