The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1901–1950 of 659983 papers

Title	Date	Status	Hype
Efficient Reasoning with Balanced Thinking	Mar 19, 2026	—Unverified	2
Weights to Code: Extracting Interpretable Algorithms from the Discrete Transformer	Mar 19, 2026	—Unverified	0
DeeperBrain: A Neuro-Grounded EEG Foundation Model Towards Universal BCI	Mar 19, 2026	—Unverified	0
Studying the Role of Synthetic Data for Machine Learning-based Wireless Networks Traffic Forecasting	Mar 19, 2026	—Unverified	0
Forest-Chat: Adapting Vision-Language Agents for Interactive Forest Change Analysis	Mar 19, 2026	—Unverified	0
Mixed-Precision Training and Compilation for RRAM-based Computing-in-Memory Accelerators	Mar 19, 2026	—Unverified	0
The Flexibility Trap: Why Arbitrary Order Limits Reasoning Potential in Diffusion Language Models	Mar 19, 2026	—Unverified	2
Koopman Autoencoders with Continuous-Time Latent Dynamics for Fluid Dynamics Forecasting	Mar 19, 2026	—Unverified	0
STELLAR: Structure-guided LLM Assertion Retrieval and Generation for Formal Verification	Mar 19, 2026	—Unverified	0
1S-DAug: One-Shot Data Augmentation for Robust Few-Shot Generalization	Mar 19, 2026	—Unverified	0
TS-Haystack: A Multi-Scale Retrieval Benchmark for Time Series Language Models	Mar 19, 2026	—Unverified	0
From Logs to Language: Learning Optimal Verbalization for LLM-Based Recommendation at Industry Scale	Mar 19, 2026	—Unverified	0
Benchmarking State Space Models, Transformers, and Recurrent Networks for US Grid Forecasting	Mar 19, 2026	—Unverified	0
What You Read is What You Classify: Highlighting Attributions to Text and Text-Like Inputs	Mar 19, 2026	—Unverified	0
Transformers Remember First, Forget Last: Dual-Process Interference in LLMs	Mar 19, 2026	—Unverified	0
AutoResearch-RL: Perpetual Self-Evaluating Reinforcement Learning Agents for Autonomous Neural Architecture Discovery	Mar 19, 2026	—Unverified	0
A Unified View of Drifting and Score-Based Models	Mar 19, 2026	—Unverified	0
Interleaving Scheduling and Motion Planning with Incremental Learning of Symbolic Space-Time Motion Abstractions	Mar 19, 2026	—Unverified	0
WebWeaver: Breaking Topology Confidentiality in LLM Multi-Agent Systems with Stealthy Context-Based Inference	Mar 19, 2026	—Unverified	0
Representation Finetuning for Continual Learning	Mar 19, 2026	—Unverified	0
A Simple Efficiency Incremental Learning Framework via Vision-Language Model with Nonlinear Multi-Adapters	Mar 19, 2026	—Unverified	0
Reversible Lifelong Model Editing via Semantic Routing-Based LoRA	Mar 19, 2026	—Unverified	0
A technology-oriented mapping of the language and translation industry: Analysing stakeholder values and their potential implication for translation pedagogy	Mar 19, 2026	—Unverified	0
COTONET: A custom cotton detection algorithm based on YOLO11 for stage of growth cotton boll detection	Mar 19, 2026	—Unverified	0
PREBA: Surgical Duration Prediction via PCA-Weighted Retrieval-Augmented LLMs and Bayesian Averaging Aggregation	Mar 19, 2026	—Unverified	0
VTC-Bench: Evaluating Agentic Multimodal Models via Compositional Visual Tool Chaining	Mar 19, 2026	—Unverified	1
Bridging the Simulation-to-Reality Gap in Electron Microscope Calibration via VAE-EM Estimation	Mar 19, 2026	—Unverified	0
Nonstandard Errors in AI Agents	Mar 19, 2026	—Unverified	0
HopChain: Multi-Hop Data Synthesis for Generalizable Vision-Language Reasoning	Mar 19, 2026	—Unverified	0
Harm or Humor: A Multimodal, Multilingual Benchmark for Overt and Covert Harmful Humor	Mar 19, 2026	—Unverified	0
The Convergence Frontier: Integrating Machine Learning and High Performance Quantum Computing for Next-Generation Drug Discovery	Mar 19, 2026	—Unverified	0
TransText: Alpha-as-RGB Representation for Transparent Text Animation	Mar 19, 2026	—Unverified	0
TDAD: Test-Driven Agentic Development - Reducing Code Regressions in AI Coding Agents via Graph-Based Impact Analysis	Mar 19, 2026	CodeCode Available	0
Pixel-Accurate Epipolar Guided Matching	Mar 19, 2026	—Unverified	0
WASD: Locating Critical Neurons as Sufficient Conditions for Explaining and Controlling LLM Behavior	Mar 19, 2026	—Unverified	0
SynQ: Accurate Zero-shot Quantization by Synthesis-aware Fine-tuning	Mar 19, 2026	—Unverified	0
PowerFlow: Unlocking the Dual Nature of LLMs via Principled Distribution Matching	Mar 19, 2026	—Unverified	0
From Weak Cues to Real Identities: Evaluating Inference-Driven De-Anonymization in LLM Agents	Mar 19, 2026	—Unverified	0
Evolutionarily Stable Stackelberg Equilibrium	Mar 19, 2026	—Unverified	0
Reflection in the Dark: Exposing and Escaping the Black Box in Reflective Prompt Optimization	Mar 19, 2026	—Unverified	0
An SO(3)-equivariant reciprocal-space neural potential for long-range interactions	Mar 19, 2026	—Unverified	0
AutoScreen-FW: An LLM-based Framework for Resume Screening	Mar 19, 2026	—Unverified	0
Computational and Statistical Hardness of Calibration Distance	Mar 19, 2026	—Unverified	0
FlowMS: Flow Matching for De Novo Structure Elucidation from Mass Spectra	Mar 19, 2026	—Unverified	0
TARo: Token-level Adaptive Routing for LLM Test-time Alignment	Mar 19, 2026	—Unverified	0
Statistical Testing Framework for Clustering Pipelines by Selective Inference	Mar 19, 2026	—Unverified	0
The Spillover Effects of Peer AI Rinsing on Corporate Green Innovation	Mar 19, 2026	—Unverified	0
AcceRL: A Distributed Asynchronous Reinforcement Learning and World Model Framework for Vision-Language-Action Models	Mar 19, 2026	—Unverified	0
Mind the Rarities: Can Rare Skin Diseases Be Reliably Diagnosed via Diagnostic Reasoning?	Mar 19, 2026	—Unverified	0
HOMEY: Heuristic Object Masking with Enhanced YOLO for Property Insurance Risk Detection	Mar 19, 2026	—Unverified	0