The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14551–14600 of 474278 papers

Title	Date	Tasks	Status	Hype
Optimizing Mastery Learning by Fast-Forwarding Over-Practice Steps	Jun 21, 2025		CodeCode Available	0
Reflective Verbal Reward Design for Pluralistic Alignment	Jun 21, 2025	Language ModelingLanguage Modelling	—Unverified	0
Enhancing Few-shot Keyword Spotting Performance through Pre-Trained Self-supervised Speech Models	Jun 21, 2025	Dimensionality ReductionKeyword Spotting	—Unverified	0
Trustworthy Chronic Disease Risk Prediction For Self-Directed Preventive Care via Medical Literature Validation	Jun 21, 2025	Disease Prediction	—Unverified	0
Research on Model Parallelism and Data Parallelism Optimization Methods in Large Language Model-Based Recommendation Systems	Jun 21, 2025	Language ModelingLanguage Modelling	—Unverified	0
Leveling the Playing Field: Carefully Comparing Classical and Learned Controllers for Quadrotor Trajectory Tracking	Jun 21, 2025	BenchmarkingReinforcement Learning (RL)	—Unverified	0
DRAMA-X: A Fine-grained Intent Prediction and Risk Reasoning Benchmark For Driving	Jun 21, 2025	Autonomous DrivingDescriptive	CodeCode Available	1
RLRC: Reinforcement Learning-based Recovery for Compressed Vision-Language-Action Models	Jun 21, 2025	Model CompressionQuantization	—Unverified	0
ConsumerBench: Benchmarking Generative AI Applications on End-User Devices	Jun 21, 2025	BenchmarkingCPU	CodeCode Available	1
Scalable Machine Learning Algorithms using Path Signatures	Jun 21, 2025	Computational EfficiencyGaussian Processes	—Unverified	0
SELFI: Selective Fusion of Identity for Generalizable Deepfake Detection	Jun 21, 2025	DeepFake DetectionFace Recognition	—Unverified	0
AdRo-FL: Informed and Secure Client Selection for Federated Learning in the Presence of Adversarial Aggregator	Jun 21, 2025	Federated LearningPrivacy Preserving	—Unverified	0
Quantum-Hybrid Support Vector Machines for Anomaly Detection in Industrial Control Systems	Jun 21, 2025	Anomaly Detection	—Unverified	0
AI Safety vs. AI Security: Demystifying the Distinction and Boundaries	Jun 21, 2025	Autonomous Vehicles	—Unverified	0
CultureMERT: Continual Pre-Training for Cross-Cultural Music Representation Learning	Jun 21, 2025	Music Auto-TaggingRepresentation Learning	—Unverified	0
CEGA: A Cost-Effective Approach for Graph-Based Model Extraction and Acquisition	Jun 21, 2025	Model extraction	CodeCode Available	0
Pix2Geomodel: A Next-Generation Reservoir Geomodeling with Property-to-Property Translation	Jun 21, 2025	Generative Adversarial NetworkProperty Prediction	—Unverified	0
Secure Energy Transactions Using Blockchain Leveraging AI for Fraud Detection and Energy Market Stability	Jun 21, 2025	Fraud Detection	—Unverified	0
PhysUniBench: An Undergraduate-Level Physics Reasoning Benchmark for Multimodal Models	Jun 21, 2025	Mathematical ReasoningMultiple-choice	—Unverified	0
Large Language Model-Driven Surrogate-Assisted Evolutionary Algorithm for Expensive Optimization	Jun 20, 2025		CodeCode Available	0
Towards AI Search Paradigm	Jun 20, 2025	Decision MakingRetrieval-augmented Generation	—Unverified	0
CORE-KG: An LLM-Driven Knowledge Graph Construction Framework for Human Smuggling Networks	Jun 20, 2025	coreference-resolutionCoreference Resolution	—Unverified	0
LSCD: Lomb-Scargle Conditioned Diffusion for Time series Imputation	Jun 20, 2025	ImputationTime Series	—Unverified	0
The Importance of Being Lazy: Scaling Limits of Continual Learning	Jun 20, 2025	Continual Learning	—Unverified	0
OmniReflect: Discovering Transferable Constitutions for LLM agents via Neuro-Symbolic Reflections	Jun 20, 2025	Computational EfficiencyLarge Language Model	—Unverified	0
RocketStack: A level-aware deep recursive ensemble learning framework with exploratory feature fusion and model pruning dynamics	Jun 20, 2025	Ensemble Learning	—Unverified	0
MemBench: Towards More Comprehensive Evaluation on the Memory of LLM-based Agents	Jun 20, 2025	Diversity	CodeCode Available	2
TransDreamerV3: Implanting Transformer In DreamerV3	Jun 20, 2025	Decision MakingMinecraft	CodeCode Available	0
Self-supervised Feature Extraction for Enhanced Ball Detection on Soccer Robots	Jun 20, 2025	ColorizationEdge Detection	—Unverified	0
UProp: Investigating the Uncertainty Propagation of LLMs in Multi-Step Agentic Decision-Making	Jun 20, 2025	Decision MakingQuestion Answering	CodeCode Available	0
Mesh-Informed Neural Operator : A Transformer Generative Approach	Jun 20, 2025	Operator learning	CodeCode Available	1
EHCube4P: Learning Epistatic Patterns Through Hypercube Graph Convolution Neural Network for Protein Fitness Function Estimation	Jun 20, 2025	Denoising	—Unverified	0
Efficient and faithful reconstruction of dynamical attractors using homogeneous differentiators	Jun 20, 2025	EEG	CodeCode Available	0
Challenges in Grounding Language in the Real World	Jun 20, 2025	Language ModelingLanguage Modelling	—Unverified	0
Identifiability of Deep Polynomial Neural Networks	Jun 20, 2025	DecoderPolynomial Neural Networks	—Unverified	0
Multi-Armed Bandits With Machine Learning-Generated Surrogate Rewards	Jun 20, 2025	Decision Making Under UncertaintyMulti-Armed Bandits	—Unverified	0
Sequence-to-Sequence Models with Attention Mechanistically Map to the Architecture of Human Memory Search	Jun 20, 2025	Machine TranslationTranslation	—Unverified	0
A Minimalist Optimizer Design for LLM Pretraining	Jun 20, 2025		CodeCode Available	1
Generative Modeling of Full-Atom Protein Conformations using Latent Diffusion on Graph Embeddings	Jun 20, 2025	Graph Neural Network	CodeCode Available	1
Optimal Depth of Neural Networks	Jun 20, 2025	Computational Efficiency	—Unverified	0
From Lab to Factory: Pitfalls and Guidelines for Self-/Unsupervised Defect Detection on Low-Quality Industrial Images	Jun 20, 2025	Defect Detection	—Unverified	0
Wi-Fi Sensing Tool Release: Gathering 802.11ax Channel State Information from a Commercial Wi-Fi Access Point	Jun 20, 2025	Gesture Recognition	—Unverified	0
Soft decision trees for survival analysis	Jun 20, 2025	FairnessSurvival Analysis	—Unverified	0
Bayesian Joint Model of Multi-Sensor and Failure Event Data for Multi-Mode Failure Prediction	Jun 20, 2025	PredictionTime Series	—Unverified	0
Beamforming design for minimizing the signal power estimation error	Jun 20, 2025		CodeCode Available	0
Brain-inspired interpretable reservoir computing with resonant recurrent neural networks	Jun 20, 2025	Classification	CodeCode Available	0
Empirical Models of the Time Evolution of SPX Option Prices	Jun 20, 2025	regression	—Unverified	0
Low-Complexity Receiver Design for Affine Filter Bank Modulation	Jun 20, 2025	ISAC	—Unverified	0
Consistent Sampling and Simulation: Molecular Dynamics with Energy-Based Diffusion Models	Jun 20, 2025		CodeCode Available	2
Metapath-based Hyperbolic Contrastive Learning for Heterogeneous Graph Embedding	Jun 20, 2025	Contrastive LearningGraph Embedding	—Unverified	0