The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11301–11350 of 661570 papers

Title	Date	Status	Hype
Buzz, Choose, Forget: A Meta-Bandit Framework for Bee-Like Decision Making	Mar 4, 2026	—Unverified	0
Leveraging Taxonomy Similarity for Next Activity Prediction in Patient Treatment	Mar 4, 2026	—Unverified	0
Beyond Accuracy: What Matters in Designing Well-Behaved Image Classification Models?	Mar 4, 2026	—Unverified	0
RLJP: Legal Judgment Prediction via First-Order Logic Rule-enhanced with Large Language Models	Mar 4, 2026	—Unverified	0
An Approximation Theory Perspective on Machine Learning	Mar 4, 2026	—Unverified	0
ObfusQAte: A Proposed Framework to Evaluate LLM Robustness on Obfuscated Factual Question Answering	Mar 4, 2026	—Unverified	0
Robust Adversarial Quantification via Conflict-Aware Evidential Deep Learning	Mar 4, 2026	—Unverified	0
EgoWorld: Translating Exocentric View to Egocentric View using Rich Exocentric Observations	Mar 4, 2026	—Unverified	0
Partial Weakly-Supervised Oriented Object Detection	Mar 4, 2026	—Unverified	0
Talking Trees: Reasoning-Assisted Induction of Decision Trees for Tabular Data	Mar 4, 2026	—Unverified	0
From Ambiguity to Accuracy: The Transformative Effect of Coreference Resolution on Retrieval-Augmented Generation systems	Mar 4, 2026	—Unverified	0
Knowing When to Quit: Probabilistic Early Exits for Speech Separation	Mar 4, 2026	—Unverified	0
Function Induction and Task Generalization: An Interpretability Study with Off-by-One Addition	Mar 4, 2026	—Unverified	0
Finite-Dimensional Gaussian Approximation for Deep Neural Networks: Universality in Random Weights	Mar 4, 2026	—Unverified	0
From Privacy to Trust in the Agentic Era: A Taxonomy of Challenges in Trustworthy Federated Learning Through the Lens of Trust Report 2.0	Mar 4, 2026	—Unverified	0
Self-Supervised Inductive Logic Programming	Mar 4, 2026	—Unverified	0
When Relevance Meets Novelty: Dual-Stable Periodic Optimization for Serendipitous Recommendation	Mar 4, 2026	—Unverified	0
WebDS: An End-to-End Benchmark for Web-based Data Science	Mar 4, 2026	—Unverified	0
ToolVQA: A Dataset for Multi-step Reasoning VQA with External Tools	Mar 4, 2026	—Unverified	0
SEVADE: Self-Evolving Multi-Agent Analysis with Decoupled Evaluation for Hallucination-Resistant Irony Detection	Mar 4, 2026	—Unverified	0
GaitSnippet: Gait Recognition Beyond Unordered Sets and Ordered Sequences	Mar 4, 2026	—Unverified	0
Stochastic Self-Guidance for Training-Free Enhancement of Diffusion Models	Mar 4, 2026	—Unverified	2
Subsampling Factorization Machine Annealing	Mar 4, 2026	—Unverified	0
Adaptive Quantized Planetary Crater Detection System for Autonomous Space Exploration	Mar 4, 2026	—Unverified	0
An LLM Agentic Approach for Legal-Critical Software: A Case Study for Tax Prep Software	Mar 4, 2026	—Unverified	0
Deep Hierarchical Learning with Nested Subspace Networks for Large Language Models	Mar 4, 2026	—Unverified	0
Bridging Computational Social Science and Deep Learning: Cultural Dissemination-Inspired Graph Neural Networks	Mar 4, 2026	—Unverified	0
Raw-JPEG Adapter: Efficient Raw Image Compression with JPEG	Mar 4, 2026	—Unverified	0
Best-of- -- Asymptotic Performance of Test-Time LLM Ensembling	Mar 4, 2026	—Unverified	0
Towards Personalized Deep Research: Benchmarks and Evaluations	Mar 4, 2026	—Unverified	0
Weakly Supervised Concept Learning with Class-Level Priors for Interpretable Medical Diagnosis	Mar 4, 2026	—Unverified	0
Learning Explicit Single-Cell Dynamics Using ODE Representations	Mar 4, 2026	—Unverified	0
TIGeR: Tool-Integrated Geometric Reasoning in Vision-Language Models for Robotics	Mar 4, 2026	—Unverified	0
Annotation-Efficient Universal Honesty Alignment	Mar 4, 2026	—Unverified	0
Kaleido: Open-Sourced Multi-Subject Reference Video Generation Model	Mar 4, 2026	—Unverified	0
Citation Failure: Definition, Analysis and Efficient Mitigation	Mar 4, 2026	—Unverified	0
Measurement-Consistent Langevin Corrector for Stabilizing Latent Diffusion Inverse Problem Solvers	Mar 4, 2026	—Unverified	0
Can a Small Model Learn to Look Before It Leaps? Dynamic Learning and Proactive Correction for Hallucination Detection	Mar 4, 2026	—Unverified	0
Categorical Emotions or Appraisals - Which Emotion Model Explains Argument Convincingness Better?	Mar 4, 2026	—Unverified	0
AudAgent: Automated Auditing of Privacy Policy Compliance in AI Agents	Mar 4, 2026	—Unverified	0
DecNefSimulator: A Modular, Interpretable Framework for Decoded Neurofeedback Simulation Using Generative Models	Mar 4, 2026	—Unverified	0
Better audio representations are more brain-like: linking model-brain alignment with performance in downstream auditory tasks	Mar 4, 2026	—Unverified	0
MatPedia: A Universal Generative Foundation for High-Fidelity Material Synthesis	Mar 4, 2026	—Unverified	0
Freezing of Gait Prediction using Proactive Agent that Learns from Selected Experience and DDQN Algorithm	Mar 4, 2026	—Unverified	0
What Triggers my Model? Contrastive Explanations Inform Gender Choices by Translation Models	Mar 4, 2026	—Unverified	0
Learning under Distributional Drift: Prequential Reproducibility as an Intrinsic Statistical Resource	Mar 4, 2026	—Unverified	0
OASI: Objective-Aware Surrogate Initialization for Multi-Objective Bayesian Optimization in TinyML Keyword Spotting	Mar 4, 2026	—Unverified	0
Online Robust Reinforcement Learning with General Function Approximation	Mar 4, 2026	—Unverified	0
Deterministic Coreset for Lp Subspace	Mar 4, 2026	—Unverified	0
AI Skills Improve Job Prospects: Causal Evidence from a Hiring Experiment	Mar 4, 2026	—Unverified	0