The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2651–2675 of 661570 papers

Title	Date	Status
FluidGaussian: Propagating Simulation-Based Uncertainty Toward Functionally-Intelligent 3D Reconstruction	Mar 22, 2026	—Unverified
AgentHER: Hindsight Experience Replay for LLM Agent Trajectory Relabeling	Mar 22, 2026	—Unverified
Benchmarking Bengali Dialectal Bias: A Multi-Stage Framework Integrating RAG-Based Translation and Human-Augmented RLAIF	Mar 22, 2026	—Unverified
AdaRubric: Task-Adaptive Rubrics for LLM Agent Evaluation	Mar 22, 2026	—Unverified
TIDE: Token-Informed Depth Execution for Per-Token Early Exit in LLM Inference	Mar 22, 2026	—Unverified
Relax Forcing: Relaxed KV-Memory for Consistent Long Video Generation	Mar 22, 2026	—Unverified
Conspiracy Frame: a Semiotically-Driven Approach for Conspiracy Theories Detection	Mar 22, 2026	—Unverified
PLR: Plackett-Luce for Reordering In-Context Learning Examples	Mar 22, 2026	—Unverified
Constrained Online Convex Optimization with Memory and Predictions	Mar 22, 2026	—Unverified
HamVision: Hamiltonian Dynamics as Inductive Bias for Medical Image Analysis	Mar 22, 2026	—Unverified
An InSAR Phase Unwrapping Framework for Large-scale and Complex Events	Mar 22, 2026	—Unverified
PivotRL: High Accuracy Agentic Post-Training at Low Compute Cost	Mar 22, 2026	—Unverified
Mitigating Objectness Bias and Region-to-Text Misalignment for Open-Vocabulary Panoptic Segmentation	Mar 22, 2026	—Unverified
Task-Specific Efficiency Analysis: When Small Language Models Outperform Large Language Models	Mar 22, 2026	—Unverified
A Generalised Exponentiated Gradient Approach to Enhance Fairness in Binary and Multi-class Classification Tasks	Mar 22, 2026	—Unverified
Mechanisms of Introspective Awareness	Mar 22, 2026	—Unverified
Persona Vectors in Games: Measuring and Steering Strategies via Activation Vectors	Mar 22, 2026	—Unverified
The Myhill-Nerode Theorem for Bounded Interaction: Canonical Abstractions via Agent-Bounded Indistinguishability	Mar 22, 2026	—Unverified
Multi-Perspective LLM Annotations for Valid Analyses in Subjective Tasks	Mar 22, 2026	—Unverified
Fingerprinting Deep Neural Networks for Ownership Protection: An Analytical Approach	Mar 22, 2026	—Unverified
Silent Commitment Failure in Instruction-Tuned Language Models: Evidence of Governability Divergence Across Architectures	Mar 22, 2026	—Unverified
Efficient Fine-Tuning Methods for Portuguese Question Answering: A Comparative Study of PEFT on BERTimbau and Exploratory Evaluation of Generative LLMs	Mar 22, 2026	—Unverified
Is the future of AI green? What can innovation diffusion models say about generative AI's environmental impact?	Mar 22, 2026	—Unverified
HyReach: Vision-Guided Hybrid Manipulator Reaching in Unseen Cluttered Environments	Mar 22, 2026	—Unverified
Uncertainty-Aware Knowledge Distillation for Multimodal Large Language Models	Mar 22, 2026	—Unverified