The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 16201–16250 of 474278 papers

Title	Date	Tasks	Status	Hype
A strengthened bound on the number of states required to characterize maximum parsimony distance	Jun 11, 2025	2k	—Unverified	0
LLM-Powered CPI Prediction Inference with Online Text Time Series	Jun 11, 2025	Prediction IntervalsTime Series	CodeCode Available	0
Generalized Gaussian Entropy Model for Point Cloud Attribute Compression with Dynamic Likelihood Intervals	Jun 11, 2025	Attributeparameter estimation	—Unverified	0
Geometry Reduced Order Modeling (GROM) with application to modeling of glymphatic function	Jun 11, 2025	Image Registration	CodeCode Available	0
An Interpretable Two-Stage Feature Decomposition Method for Deep Learning-based SAR ATR	Jun 11, 2025	AttributeClustering	—Unverified	0
Intelligent Travel Activity Monitoring: Generalized Distributed Acoustic Sensing Approaches	Jun 11, 2025	Federated LearningMeta-Learning	—Unverified	0
Deep Semantic Segmentation for Multi-Source Localization Using Angle of Arrival Measurements	Jun 11, 2025	Semantic Segmentation	—Unverified	0
Knockoffs Inference under Privacy Constraints	Jun 11, 2025	Variable Selection	—Unverified	0
Assessing the Quality of Denoising Diffusion Models in Wasserstein Distance: Noisy Score and Optimal Bounds	Jun 11, 2025	Denoising	CodeCode Available	0
A Cytology Dataset for Early Detection of Oral Squamous Cell Carcinoma	Jun 11, 2025	Anomaly ClassificationDiagnostic	CodeCode Available	0
Vision Matters: Simple Visual Perturbations Can Boost Multimodal Math Reasoning	Jun 11, 2025	Image CaptioningMath	CodeCode Available	2
ReasonMed: A 370K Multi-Agent Generated Dataset for Advancing Medical Reasoning	Jun 11, 2025	Medical Question AnsweringQuestion Answering	CodeCode Available	2
SkillBlender: Towards Versatile Humanoid Whole-Body Loco-Manipulation via Skill Blending	Jun 11, 2025	Hierarchical Reinforcement LearningHumanoid Control	CodeCode Available	2
Empirical Quantification of Spurious Correlations in Malware Detection	Jun 11, 2025	Deep LearningMalware Detection	—Unverified	0
A Study on Speech Assessment with Visual Cues	Jun 11, 2025	Multi-Task Learning	—Unverified	0
Natural Language Guided Ligand-Binding Protein Design	Jun 11, 2025	Protein Design	—Unverified	0
Learning Obfuscations Of LLM Embedding Sequences: Stained Glass Transform	Jun 11, 2025	Word Embeddings	—Unverified	0
SLED: A Speculative LLM Decoding Framework for Efficient Edge Serving	Jun 11, 2025	Edge-computingQuantization	—Unverified	0
Adv-BMT: Bidirectional Motion Transformer for Safety-Critical Traffic Scenario Generation	Jun 11, 2025	Autonomous Driving	—Unverified	0
Fine-Tuning Large Audio-Language Models with LoRA for Precise Temporal Localization of Prolonged Exposure Therapy Elements	Jun 11, 2025	Temporal Localization	—Unverified	0
Multi-Agent Language Models: Advancing Cooperation, Coordination, and Adaptation	Jun 11, 2025	Multi-agent Reinforcement Learning	—Unverified	0
Time-Unified Diffusion Policy with Action Discrimination for Robotic Manipulation	Jun 11, 2025	Action GenerationAction Recognition	—Unverified	0
DCIRNet: Depth Completion with Iterative Refinement for Dexterous Grasping of Transparent and Reflective Objects	Jun 11, 2025	Depth CompletionDepth Estimation	—Unverified	0
Estimating the Number of Components in Panel Data Finite Mixture Regression Models with an Application to Production Function Heterogeneity	Jun 11, 2025	Model Selection	—Unverified	0
Diffusion index forecasts under weaker loadings: PCA, ridge regression, and random projections	Jun 11, 2025	regression	—Unverified	0
You Are What You Say: Exploiting Linguistic Content for VoicePrivacy Attacks	Jun 11, 2025	Language ModelingLanguage Modelling	—Unverified	0
Neutral theory of cooperators	Jun 11, 2025	Diversity	—Unverified	0
Recognizing Every Voice: Towards Inclusive ASR for Rural Bhojpuri Women	Jun 11, 2025		CodeCode Available	0
Alice and the Caterpillar: A more descriptive null model for assessing data mining results	Jun 11, 2025	Descriptive	CodeCode Available	0
Metritocracy: Representative Metrics for Lite Benchmarks	Jun 11, 2025	Position	—Unverified	0
Efficient Prediction of SO(3)-Equivariant Hamiltonian Matrices via SO(2) Local Frames	Jun 11, 2025		—Unverified	0
Probability-One Optimization of Generalized Rayleigh Quotient Sum For Multi-Source Generalized Total Least-Squares	Jun 11, 2025	global-optimization	—Unverified	0
Model Predictive Control-Based Optimal Energy Management of Autonomous Electric Vehicles Under Cold Temperatures	Jun 11, 2025	energy managementManagement	—Unverified	0
CheckManual: A New Challenge and Benchmark for Manual-based Appliance Manipulation	Jun 11, 2025	Common Sense ReasoningQuestion Answering	—Unverified	0
Simulation-trained conditional normalizing flows for likelihood approximation: a case study in stress regulation kinetics in yeast	Jun 11, 2025	parameter estimation	CodeCode Available	0
SAGE: Exploring the Boundaries of Unsafe Concept Domain with Semantic-Augment Erasing	Jun 11, 2025	Image GenerationText to Image Generation	CodeCode Available	0
The COVID-19 Inflation Weighting in Israel	Jun 11, 2025		CodeCode Available	0
Beyond Nash Equilibrium: Bounded Rationality of LLMs and humans in Strategic Decision-making	Jun 11, 2025	Decision Making	—Unverified	0
OWSM-Biasing: Contextualizing Open Whisper-Style Speech Models for Automatic Speech Recognition with Dynamic Vocabulary	Jun 11, 2025	Automatic Speech Recognitionspeech-recognition	—Unverified	0
Reasoning as a Resource: Optimizing Fast and Slow Thinking in Code Generation Models	Jun 11, 2025	BenchmarkingCode Generation	—Unverified	0
Optimization and Control Technologies for Renewable-Dominated Hydrogen-Blended Integrated Gas-Electricity System: A Review	Jun 11, 2025	Scheduling	—Unverified	0
Integer-Clustering Optimization of Hydrogen and Battery EV Fleets Considering DERs	Jun 11, 2025	Clustering	—Unverified	0
BemaGANv2: A Tutorial and Comparative Survey of GAN-based Vocoders for Long-Term Audio Generation	Jun 11, 2025	Audio GenerationFAD	CodeCode Available	1
CoLMbo: Speaker Language Model for Descriptive Profiling	Jun 11, 2025	DescriptiveLanguage Modeling	CodeCode Available	0
Tightly-Coupled LiDAR-IMU-Leg Odometry with Online Learned Leg Kinematics Incorporating Foot Tactile Information	Jun 11, 2025		CodeCode Available	2
Attention, Please! Revisiting Attentive Probing for Masked Image Modeling	Jun 11, 2025	BenchmarkingComputational Efficiency	CodeCode Available	1
Towards Open Foundation Language Model and Corpus for Macedonian: A Low-Resource Language	Jun 11, 2025	Language ModelingLanguage Modelling	—Unverified	0
eFlesh: Highly customizable Magnetic Touch Sensing using Cut-Cell Microstructures	Jun 11, 2025		—Unverified	0
From Judgment to Interference: Early Stopping LLM Harmful Outputs via Streaming Content Monitoring	Jun 11, 2025	Safety Alignment	—Unverified	0
Synergizing Reinforcement Learning and Genetic Algorithms for Neural Combinatorial Optimization	Jun 11, 2025	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified	0