The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1101–1150 of 659983 papers

Title	Date	Status
Reframing Long-Tailed Learning via Loss Landscape Geometry	Mar 22, 2026	—Unverified
ConsRoute:Consistency-Aware Adaptive Query Routing for Cloud-Edge-Device Large Language Models	Mar 22, 2026	—Unverified
Amortized Variational Inference for Logistic Regression with Missing Covariates	Mar 22, 2026	—Unverified
Accelerate Vector Diffusion Maps by Landmarks	Mar 22, 2026	—Unverified
Graph Fusion Across Languages using Large Language Models	Mar 22, 2026	—Unverified
Graph of States: Solving Abductive Tasks with Large Language Models	Mar 22, 2026	—Unverified
The Library Theorem: How External Organization Governs Agentic Reasoning Capacity	Mar 22, 2026	—Unverified
Aggregation Alignment for Federated Learning with Mixture-of-Experts under Data Heterogeneity	Mar 22, 2026	—Unverified
Conversation Tree Architecture: A Structured Framework for Context-Aware Multi-Branch LLM Conversations	Mar 22, 2026	—Unverified
Closed-form conditional diffusion models for data assimilation	Mar 22, 2026	—Unverified
AutoKernel: Autonomous GPU Kernel Optimization via Iterative Agent-Driven Search	Mar 22, 2026	—Unverified
EmoTaG: Emotion-Aware Talking Head Synthesis on Gaussian Splatting with Few-Shot Personalization	Mar 22, 2026	—Unverified
ARYA: A Physics-Constrained Composable & Deterministic World Model Architecture	Mar 22, 2026	—Unverified
RoboAlign: Learning Test-Time Reasoning for Language-Action Alignment in Vision-Language-Action Models	Mar 22, 2026	—Unverified
Generalized Discrete Diffusion from Snapshots	Mar 22, 2026	—Unverified
The AI Scientific Community: Agentic Virtual Lab Swarms	Mar 22, 2026	—Unverified
Efficient Coarse-to-Fine Diffusion Models with Time Step Sequence Redistribution	Mar 22, 2026	—Unverified
Respiratory Status Detection with Video Transformers	Mar 22, 2026	—Unverified
Beyond Memorization: Distinguishing between Reductive and Epistemic Reasoning in LLMs using Classic Logic Puzzles	Mar 22, 2026	—Unverified
The Workload-Router-Pool Architecture for LLM Inference Optimization: A Vision Paper from the vLLM Semantic Router Project	Mar 22, 2026	—Unverified
FluidGaussian: Propagating Simulation-Based Uncertainty Toward Functionally-Intelligent 3D Reconstruction	Mar 22, 2026	—Unverified
AgentHER: Hindsight Experience Replay for LLM Agent Trajectory Relabeling	Mar 22, 2026	—Unverified
Benchmarking Bengali Dialectal Bias: A Multi-Stage Framework Integrating RAG-Based Translation and Human-Augmented RLAIF	Mar 22, 2026	—Unverified
AdaRubric: Task-Adaptive Rubrics for LLM Agent Evaluation	Mar 22, 2026	—Unverified
TIDE: Token-Informed Depth Execution for Per-Token Early Exit in LLM Inference	Mar 22, 2026	—Unverified
Relax Forcing: Relaxed KV-Memory for Consistent Long Video Generation	Mar 22, 2026	—Unverified
Conspiracy Frame: a Semiotically-Driven Approach for Conspiracy Theories Detection	Mar 22, 2026	—Unverified
PLR: Plackett-Luce for Reordering In-Context Learning Examples	Mar 22, 2026	—Unverified
Constrained Online Convex Optimization with Memory and Predictions	Mar 22, 2026	—Unverified
HamVision: Hamiltonian Dynamics as Inductive Bias for Medical Image Analysis	Mar 22, 2026	—Unverified
An InSAR Phase Unwrapping Framework for Large-scale and Complex Events	Mar 22, 2026	—Unverified
PivotRL: High Accuracy Agentic Post-Training at Low Compute Cost	Mar 22, 2026	—Unverified
Mitigating Objectness Bias and Region-to-Text Misalignment for Open-Vocabulary Panoptic Segmentation	Mar 22, 2026	—Unverified
Task-Specific Efficiency Analysis: When Small Language Models Outperform Large Language Models	Mar 22, 2026	—Unverified
A Generalised Exponentiated Gradient Approach to Enhance Fairness in Binary and Multi-class Classification Tasks	Mar 22, 2026	—Unverified
Mechanisms of Introspective Awareness	Mar 22, 2026	—Unverified
Persona Vectors in Games: Measuring and Steering Strategies via Activation Vectors	Mar 22, 2026	—Unverified
The Myhill-Nerode Theorem for Bounded Interaction: Canonical Abstractions via Agent-Bounded Indistinguishability	Mar 22, 2026	—Unverified
Multi-Perspective LLM Annotations for Valid Analyses in Subjective Tasks	Mar 22, 2026	—Unverified
Fingerprinting Deep Neural Networks for Ownership Protection: An Analytical Approach	Mar 22, 2026	—Unverified
Silent Commitment Failure in Instruction-Tuned Language Models: Evidence of Governability Divergence Across Architectures	Mar 22, 2026	—Unverified
Efficient Fine-Tuning Methods for Portuguese Question Answering: A Comparative Study of PEFT on BERTimbau and Exploratory Evaluation of Generative LLMs	Mar 22, 2026	—Unverified
Is the future of AI green? What can innovation diffusion models say about generative AI's environmental impact?	Mar 22, 2026	—Unverified
HyReach: Vision-Guided Hybrid Manipulator Reaching in Unseen Cluttered Environments	Mar 22, 2026	—Unverified
Uncertainty-Aware Knowledge Distillation for Multimodal Large Language Models	Mar 22, 2026	—Unverified
Image-Based Structural Analysis Using Computer Vision and LLMs: PhotoBeamSolver	Mar 22, 2026	—Unverified
Left Behind: Cross-Lingual Transfer as a Bridge for Low-Resource Languages in Large Language Models	Mar 22, 2026	—Unverified
Single-Eye View: Monocular Real-time Perception Package for Autonomous Driving	Mar 22, 2026	—Unverified
Gradient Descent with Projection Finds Over-Parameterized Neural Networks for Learning Low-Degree Polynomials with Nearly Minimax Optimal Rate	Mar 22, 2026	—Unverified
LongCat-Flash-Prover: Advancing Native Formal Reasoning via Agentic Tool-Integrated Reinforcement Learning	Mar 22, 2026	—Unverified