The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3451–3475 of 661570 papers

Title	Date	Status	Hype
Mixed-Precision Training and Compilation for RRAM-based Computing-in-Memory Accelerators	Mar 19, 2026	—Unverified	0
The Flexibility Trap: Why Arbitrary Order Limits Reasoning Potential in Diffusion Language Models	Mar 19, 2026	—Unverified	2
Koopman Autoencoders with Continuous-Time Latent Dynamics for Fluid Dynamics Forecasting	Mar 19, 2026	—Unverified	0
STELLAR: Structure-guided LLM Assertion Retrieval and Generation for Formal Verification	Mar 19, 2026	—Unverified	0
1S-DAug: One-Shot Data Augmentation for Robust Few-Shot Generalization	Mar 19, 2026	—Unverified	0
TS-Haystack: A Multi-Scale Retrieval Benchmark for Time Series Language Models	Mar 19, 2026	—Unverified	0
From Logs to Language: Learning Optimal Verbalization for LLM-Based Recommendation at Industry Scale	Mar 19, 2026	—Unverified	0
Benchmarking State Space Models, Transformers, and Recurrent Networks for US Grid Forecasting	Mar 19, 2026	—Unverified	0
What You Read is What You Classify: Highlighting Attributions to Text and Text-Like Inputs	Mar 19, 2026	—Unverified	0
Transformers Remember First, Forget Last: Dual-Process Interference in LLMs	Mar 19, 2026	—Unverified	0
AutoResearch-RL: Perpetual Self-Evaluating Reinforcement Learning Agents for Autonomous Neural Architecture Discovery	Mar 19, 2026	—Unverified	0
A Unified View of Drifting and Score-Based Models	Mar 19, 2026	—Unverified	0
Interleaving Scheduling and Motion Planning with Incremental Learning of Symbolic Space-Time Motion Abstractions	Mar 19, 2026	—Unverified	0
WebWeaver: Breaking Topology Confidentiality in LLM Multi-Agent Systems with Stealthy Context-Based Inference	Mar 19, 2026	—Unverified	0
Representation Finetuning for Continual Learning	Mar 19, 2026	—Unverified	0
A Simple Efficiency Incremental Learning Framework via Vision-Language Model with Nonlinear Multi-Adapters	Mar 19, 2026	—Unverified	0
Reversible Lifelong Model Editing via Semantic Routing-Based LoRA	Mar 19, 2026	—Unverified	0
A technology-oriented mapping of the language and translation industry: Analysing stakeholder values and their potential implication for translation pedagogy	Mar 19, 2026	—Unverified	0
COTONET: A custom cotton detection algorithm based on YOLO11 for stage of growth cotton boll detection	Mar 19, 2026	—Unverified	0
PREBA: Surgical Duration Prediction via PCA-Weighted Retrieval-Augmented LLMs and Bayesian Averaging Aggregation	Mar 19, 2026	—Unverified	0
VTC-Bench: Evaluating Agentic Multimodal Models via Compositional Visual Tool Chaining	Mar 19, 2026	—Unverified	1
Bridging the Simulation-to-Reality Gap in Electron Microscope Calibration via VAE-EM Estimation	Mar 19, 2026	—Unverified	0
Nonstandard Errors in AI Agents	Mar 19, 2026	—Unverified	0
HopChain: Multi-Hop Data Synthesis for Generalizable Vision-Language Reasoning	Mar 19, 2026	—Unverified	0
Harm or Humor: A Multimodal, Multilingual Benchmark for Overt and Covert Harmful Humor	Mar 19, 2026	—Unverified	0