The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9201–9250 of 661570 papers

Title	Date	Status	Hype
Large Language Model-Assisted Superconducting Qubit Experiments	Mar 9, 2026	—Unverified	0
VoxEmo: Benchmarking Speech Emotion Recognition with Speech LLMs	Mar 9, 2026	—Unverified	0
How Far Can Unsupervised RLVR Scale LLM Training?	Mar 9, 2026	—Unverified	0
Deterministic Differentiable Structured Pruning for Large Language Models	Mar 9, 2026	—Unverified	0
Test-Time Modification: Inverse Domain Transformation for Robust Perception	Mar 9, 2026	—Unverified	0
BEV-Patch-PF: Particle Filtering with BEV-Aerial Feature Matching for Off-Road Geo-Localization	Mar 9, 2026	—Unverified	0
Computing Evolutionarily Stable Strategies in Multiplayer Games	Mar 9, 2026	—Unverified	0
ExGS: Extreme 3D Gaussian Compression with Diffusion Priors	Mar 9, 2026	CodeCode Available	0
Revisiting Unknowns: Towards Effective and Efficient Open-Set Active Learning	Mar 9, 2026	CodeCode Available	0
FinToolBench: Evaluating LLM Agents for Real-World Financial Tool Use	Mar 9, 2026	—Unverified	1
CoCo: Code as CoT for Text-to-Image Preview and Rare Concept Generation	Mar 9, 2026	CodeCode Available	0
NetDiffuser: Deceiving DNN-Based Network Attack Detection Systems with Diffusion-Generated Adversarial Traffic	Mar 9, 2026	—Unverified	0
Characterizing MARL for Energy Control: A Multi-KPI Benchmark on the CityLearn Environment	Mar 9, 2026	—Unverified	0
Rethinking Discrete Speech Representation Tokens for Accent Generation	Mar 9, 2026	—Unverified	0
Arbiter: Detecting Interference in LLM Agent System Prompts	Mar 9, 2026	—Unverified	0
Detecting AI-Generated Images via Contextual Anomaly Estimation in Masked AutoEncoders	Mar 9, 2026	—Unverified	0
Interpretable Motion-Attentive Maps: Spatio-Temporally Localizing Concepts in Video Diffusion Transformers	Mar 9, 2026	—Unverified	0
Information Routing in Atomistic Foundation Models: How Task Alignment and Equivariance Shape Linear Disentanglement	Mar 9, 2026	—Unverified	0
AI Agents, Language, Deep Learning and the Next Revolution in Science	Mar 9, 2026	—Unverified	0
FedMomentum: Preserving LoRA Training Momentum in Federated Fine-Tuning	Mar 9, 2026	—Unverified	0
RexDrug: Reliable Multi-Drug Combination Extraction through Reasoning-Enhanced LLMs	Mar 9, 2026	CodeCode Available	0
Graph-Instructed Neural Networks for parametric problems with varying boundary conditions	Mar 9, 2026	—Unverified	0
Retrieval-Augmented Anatomical Guidance for Text-to-CT Generation	Mar 9, 2026	—Unverified	0
HDR-NSFF: High Dynamic Range Neural Scene Flow Fields	Mar 9, 2026	—Unverified	0
AULLM++: Structural Reasoning with Large Language Models for Micro-Expression Recognition	Mar 9, 2026	—Unverified	0
Can Vision-Language Models Solve the Shell Game?	Mar 9, 2026	—Unverified	1
Don't Look Back in Anger: MAGIC Net for Streaming Continual Learning with Temporal Dependence	Mar 9, 2026	—Unverified	0
Evaluating Financial Intelligence in Large Language Models: Benchmarking SuperInvesting AI with LLM Engines	Mar 9, 2026	—Unverified	0
The Gaussian-Multinoulli Restricted Boltzmann Machine: A Potts Model Extension of the GRBM	Mar 9, 2026	—Unverified	0
One Language, Two Scripts: Probing Script-Invariance in LLM Concept Representations	Mar 9, 2026	—Unverified	0
MetricNet: Recovering Metric Scale in Generative Navigation Policies	Mar 9, 2026	—Unverified	0
Integral Formulas for Vector Spherical Tensor Products	Mar 9, 2026	—Unverified	0
A Unified Framework for Zero-Shot Reinforcement Learning	Mar 9, 2026	—Unverified	0
SAIL: Test-Time Scaling for In-Context Imitation Learning with VLM	Mar 9, 2026	—Unverified	0
Interactive World Simulator for Robot Policy Training and Evaluation	Mar 9, 2026	—Unverified	0
TIDE: Text-Informed Dynamic Extrapolation with Step-Aware Temperature Control for Diffusion Transformers	Mar 9, 2026	—Unverified	0
A Lightweight Traffic Map for Efficient Anytime LaCAM*	Mar 9, 2026	—Unverified	0
Adaptive Entropy-Driven Sensor Selection in a Camera-LiDAR Particle Filter for Single-Vessel Tracking	Mar 9, 2026	—Unverified	0
Trust via Reputation of Conviction	Mar 9, 2026	—Unverified	0
Boosting MLLM Spatial Reasoning with Geometrically Referenced 3D Scene Representations	Mar 9, 2026	—Unverified	0
Momentum SVGD-EM for Accelerated Maximum Marginal Likelihood Estimation	Mar 9, 2026	—Unverified	0
Sign Identifiability of Causal Effects in Stationary Stochastic Dynamical Systems	Mar 9, 2026	—Unverified	0
Not All Queries Need Deep Thought: CoFiCot for Adaptive Coarse-to-fine Stateful Refinement	Mar 9, 2026	—Unverified	0
LycheeCluster: Efficient Long-Context Inference with Structure-Aware Chunking and Hierarchical KV Indexing	Mar 9, 2026	—Unverified	0
Generative Adversarial Regression (GAR): Learning Conditional Risk Scenarios	Mar 9, 2026	—Unverified	0
FOMO-3D: Using Vision Foundation Models for Long-Tailed 3D Object Detection	Mar 9, 2026	—Unverified	0
SkipGS: Post-Densification Backward Skipping for Efficient 3DGS Training	Mar 9, 2026	—Unverified	0
MERIT Feedback Elicits Better Bargaining in LLM Negotiators	Mar 9, 2026	—Unverified	0
Scale Space Diffusion	Mar 9, 2026	—Unverified	1
Automated Thematic Analysis for Clinical Qualitative Data: Iterative Codebook Refinement with Full Provenance	Mar 9, 2026	—Unverified	0