The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3651–3700 of 659983 papers

Title	Date	Status	Hype
MobileLLM-Flash: Latency-Guided On-Device LLM Design for Industry Scale	Mar 16, 2026	—Unverified	0
AGCD: Agent-Guided Cross-Modal Decoding for Weather Forecasting	Mar 16, 2026	—Unverified	0
Understanding Reasoning in LLMs through Strategic Information Allocation under Uncertainty	Mar 16, 2026	—Unverified	0
Learnability with Partial Labels and Adaptive Nearest Neighbors	Mar 16, 2026	—Unverified	0
Semi-Autonomous Formalization of the Vlasov-Maxwell-Landau Equilibrium	Mar 16, 2026	—Unverified	1
EndoCoT: Scaling Endogenous Chain-of-Thought Reasoning in Diffusion Models	Mar 16, 2026	—Unverified	1
Revisiting Model Stitching In the Foundation Model Era	Mar 16, 2026	—Unverified	0
Neural Value Iteration	Mar 16, 2026	—Unverified	0
Self-Supervised ImageNet Representations for In Vivo Confocal Microscopy: Tortuosity Grading without Segmentation Maps	Mar 16, 2026	—Unverified	0
Pretraining and Benchmarking Modern Encoders for Latvian	Mar 16, 2026	—Unverified	0
Deep Reinforcement Learning for Fano Hypersurfaces	Mar 16, 2026	—Unverified	0
BIS Reasoning 1.0: The First Large-Scale Japanese Benchmark for Belief-Inconsistent Syllogistic Reasoning	Mar 16, 2026	—Unverified	0
Seismic full-waveform inversion based on a physics-driven generative adversarial network	Mar 16, 2026	—Unverified	0
SRL-MAD: Structured Residual Latents for One-Class Morphing Attack Detection	Mar 16, 2026	—Unverified	0
Establishing Construct Validity in LLM Capability Benchmarks Requires Nomological Networks	Mar 16, 2026	—Unverified	0
Predictive Uncertainty in Short-Term PV Forecasting under Missing Data: A Multiple Imputation Approach	Mar 16, 2026	—Unverified	0
Are LLMs Good Text Diacritizers? An Arabic and Yoruba Case Study	Mar 16, 2026	—Unverified	0
T-FIX: Text-Based Explanations with Features Interpretable to eXperts	Mar 16, 2026	—Unverified	0
Self Voice Conversion as an Attack against Neural Audio Watermarking	Mar 16, 2026	—Unverified	0
CRASH: Cognitive Reasoning Agent for Safety Hazards in Autonomous Driving	Mar 16, 2026	—Unverified	0
Generative Semantic HARQ: Latent-Space Text Retransmission and Combining	Mar 16, 2026	—Unverified	0
Towards Foundation Models for Consensus Rank Aggregation	Mar 16, 2026	—Unverified	0
Bridging National and International Legal Data: Two Projects Based on the Japanese Legal Standard XML Schema for Comparative Law Studies	Mar 16, 2026	—Unverified	0
Coherent Audio-Visual Editing via Conditional Audio Generation Following Video Edits	Mar 16, 2026	—Unverified	0
InterPol: De-anonymizing LM Arena via Interpolated Preference Learning	Mar 16, 2026	—Unverified	0
DS^2-Instruct: Domain-Specific Data Synthesis for Large Language Models Instruction Tuning	Mar 16, 2026	—Unverified	0
BayesBreak: Generalized Hierarchical Bayesian Segmentation with Irregular Designs, Multi-Sample Hierarchies, and Grouped/Latent-Group Designs	Mar 16, 2026	—Unverified	0
CLRNet: Targetless Extrinsic Calibration for Camera, Lidar and 4D Radar Using Deep Learning	Mar 16, 2026	—Unverified	0
Algorithmic Trading Strategy Development and Optimisation	Mar 16, 2026	—Unverified	0
DAST: A Dual-Stream Voice Anonymization Attacker with Staged Training	Mar 16, 2026	—Unverified	0
Fuz-RL: A Fuzzy-Guided Robust Framework for Safe Reinforcement Learning under Uncertainty	Mar 16, 2026	—Unverified	0
Efficient Story Point Estimation With Comparative Learning	Mar 16, 2026	—Unverified	0
LLM-Driven Instance-Specific Heuristic Generation and Selection	Mar 16, 2026	—Unverified	0
Multiresolution Analysis and Statistical Thresholding on Dynamic Networks	Mar 16, 2026	—Unverified	0
Convergence and clustering analysis for Mean Shift with radially symmetric, positive definite kernels	Mar 16, 2026	—Unverified	0
WaRA: Wavelet Low Rank Adaptation	Mar 16, 2026	CodeCode Available	0
Disentangled Feature Importance	Mar 16, 2026	—Unverified	0
SpatialViz-Bench: A Cognitively-Grounded Benchmark for Diagnosing Spatial Visualization in MLLMs	Mar 16, 2026	—Unverified	0
Data-Efficient ASR Personalization for Non-Normative Speech Using an Uncertainty-Based Phoneme Difficulty Score for Guided Sampling	Mar 16, 2026	—Unverified	0
Chart-R1: Chain-of-Thought Supervision and Reinforcement for Advanced Chart Reasoner	Mar 16, 2026	—Unverified	0
Cropping outperforms dropout as an augmentation strategy for self-supervised training of text embeddings	Mar 16, 2026	—Unverified	0
STEMTOX: From Social Tags to Fine-Grained Toxic Meme Detection via Entropy-Guided Multi-Task Learning	Mar 16, 2026	—Unverified	0
Towards Privacy-Preserving Machine Translation at the Inference Stage: A New Task and Benchmark	Mar 16, 2026	—Unverified	0
Benchmarking LLM-based agents for single-cell omics analysis	Mar 16, 2026	—Unverified	0
Surgical Video Understanding with Label Interpolation	Mar 16, 2026	—Unverified	0
EMMA: Generalizing Real-World Robot Manipulation via Generative Visual Transfer	Mar 16, 2026	—Unverified	0
Grounded Misunderstandings in Asymmetric Dialogue: A Perspectivist Annotation Scheme for MapTask	Mar 16, 2026	—Unverified	0
Collaborating Vision, Depth, and Thermal Signals for Multi-Modal Tracking: Dataset and Algorithm	Mar 16, 2026	—Unverified	0
YOLO26: Key Architectural Enhancements and Performance Benchmarking for Real-Time Object Detection	Mar 16, 2026	—Unverified	0
Convergence of Distributionally Robust Q-Learning with Linear Function Approximation	Mar 16, 2026	—Unverified	0