The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 15051–15100 of 474278 papers

Title	Date	Tasks	Status	Hype
Toward Safety-First Human-Like Decision Making for Autonomous Vehicles in Time-Varying Traffic Flow	Jun 17, 2025	Autonomous DrivingAutonomous Vehicles	—Unverified	0
AgentDistill: Training-Free Agent Distillation with Generalizable MCP Boxes	Jun 17, 2025	Knowledge DistillationTransfer Learning	—Unverified	0
SKOLR: Structured Koopman Operator Linear RNN for Time-Series Forecasting	Jun 17, 2025	Time SeriesTime Series Forecasting	—Unverified	0
CLGNN: A Contrastive Learning-based GNN Model for Betweenness Centrality Prediction on Temporal Graphs	Jun 17, 2025	Contrastive LearningGraph Neural Network	—Unverified	0
DiffusionBlocks: Blockwise Training for Generative Models via Score-Based Diffusion	Jun 17, 2025	DenoisingImage Generation	—Unverified	0
IntelliLung: Advancing Safe Mechanical Ventilation using Offline RL with Hybrid Actions and Clinically Aligned Rewards	Jun 17, 2025	Offline RLReinforcement Learning (RL)	—Unverified	0
ResNets Are Deeper Than You Think	Jun 17, 2025	Inductive Bias	—Unverified	0
HiLight: A Hierarchical Reinforcement Learning Framework with Global Adversarial Guidance for Large-Scale Traffic Signal Control	Jun 17, 2025	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Is Selection All You Need in Differential Evolution?	Jun 17, 2025	All	—Unverified	0
Sharp Generalization Bounds for Foundation Models with Asymmetric Randomized Low-Rank Adapters	Jun 17, 2025	Generalization Boundsparameter-efficient fine-tuning	—Unverified	0
Object-Centric Neuro-Argumentative Learning	Jun 17, 2025	Deep LearningObject	CodeCode Available	0
Unified Software Engineering agent as AI Software Engineer	Jun 17, 2025	Large Language Model	—Unverified	0
Universal Rates of ERM for Agnostic Learning	Jun 17, 2025	Binary Classification	—Unverified	0
Multi-Scale Finetuning for Encoder-based Time Series Foundation Models	Jun 17, 2025	Time SeriesTime Series Forecasting	—Unverified	0
Unsupervised Skill Discovery through Skill Regions Differentiation	Jun 17, 2025	Density EstimationReinforcement Learning (RL)	—Unverified	0
A General Framework for Off-Policy Learning with Partially-Observed Reward	Jun 17, 2025	Multi-Armed Bandits	—Unverified	0
Detecting immune cells with label-free two-photon autofluorescence and deep learning	Jun 17, 2025	Binary ClassificationClassification	—Unverified	0
Zeroth-Order Optimization is Secretly Single-Step Policy Optimization	Jun 17, 2025	Reinforcement Learning (RL)	—Unverified	0
Feasibility-Driven Trust Region Bayesian Optimization	Jun 17, 2025	Bayesian Optimization	—Unverified	0
Reimagining Target-Aware Molecular Generation through Retrieval-Enhanced Aligned Diffusion	Jun 17, 2025	Drug DesignDrug Discovery	—Unverified	0
The Perception of Phase Intercept Distortion and its Application in Data Augmentation	Jun 17, 2025	Data Augmentation	—Unverified	0
Capacity Matters: a Proof-of-Concept for Transformer Memorization on Real-World Data	Jun 17, 2025	Memorization	CodeCode Available	0
MOL: Joint Estimation of Micro-Expression, Optical Flow, and Landmark via Transformer-Graph-Style Convolution	Jun 17, 2025	Facial Landmark DetectionMicro Expression Recognition	CodeCode Available	1
GUI-Robust: A Comprehensive Dataset for Testing GUI Agent Robustness in Real-World Anomalies	Jun 17, 2025	Benchmarking	CodeCode Available	1
Deep Learning Surrogates for Real-Time Gas Emission Inversion	Jun 17, 2025	Bayesian InferenceDeep Learning	—Unverified	0
Unsupervised Imaging Inverse Problems with Diffusion Distribution Matching	Jun 17, 2025	Blind Super-ResolutionDeblurring	CodeCode Available	1
3DGS-IEval-15K: A Large-scale Image Quality Evaluation Database for 3D Gaussian-Splatting	Jun 17, 2025	3DGSImage Quality Assessment	CodeCode Available	1
Iterative Camera-LiDAR Extrinsic Optimization via Surrogate Diffusion	Jun 17, 2025	Autonomous VehiclesDenoising	CodeCode Available	0
Chaining Event Spans for Temporal Relation Grounding	Jun 17, 2025	Reading ComprehensionRelation	CodeCode Available	0
Re-Initialization Token Learning for Tool-Augmented Large Language Models	Jun 17, 2025	GSM8KQuestion Answering	CodeCode Available	0
ImpliRet: Benchmarking the Implicit Fact Retrieval Challenge	Jun 17, 2025	BenchmarkingRetrieval	CodeCode Available	0
How Far Can LLMs Improve from Experience? Measuring Test-Time Learning Ability in LLMs with Human Comparison	Jun 17, 2025		CodeCode Available	0
AlphaDecay: Module-wise Weight Decay for Heavy-Tailed Balancing in LLMs	Jun 17, 2025	Diversity	CodeCode Available	0
GenerationPrograms: Fine-grained Attribution with Executable Programs	Jun 17, 2025	Document SummarizationLong Form Question Answering	CodeCode Available	0
Optimizing Length Compression in Large Reasoning Models	Jun 17, 2025		CodeCode Available	1
Into the Unknown: Applying Inductive Spatial-Semantic Location Embeddings for Predicting Individuals' Mobility Beyond Visited Places	Jun 17, 2025	Contrastive LearningPrediction	CodeCode Available	0
AST-Enhanced or AST-Overloaded? The Surprising Impact of Hybrid Graph Representations on Code Clone Detection	Jun 17, 2025	Clone DetectionGraph Attention	CodeCode Available	0
Leveraging External Factors in Household-Level Electrical Consumption Forecasting using Hypernetworks	Jun 17, 2025	energy managementTime Series Forecasting	CodeCode Available	0
Common Benchmarks Undervalue the Generalization Power of Programmatic Policies	Jun 17, 2025	Sequential Decision Making	CodeCode Available	0
Towards Robust Learning to Optimize with Theoretical Guarantees	Jun 17, 2025		CodeCode Available	0
A Scalable Hybrid Training Approach for Recurrent Spiking Neural Networks	Jun 17, 2025		CodeCode Available	0
Model compression using knowledge distillation with integrated gradients	Jun 17, 2025	Data AugmentationKnowledge Distillation	—Unverified	0
Scaling Intelligence: Designing Data Centers for Next-Gen Language Models	Jun 17, 2025	Mixture-of-Experts	—Unverified	0
The use of cross validation in the analysis of designed experiments	Jun 17, 2025	Model Selection	CodeCode Available	0
Abstract Meaning Representation for Hospital Discharge Summarization	Jun 17, 2025	Abstract Meaning RepresentationHallucination	CodeCode Available	0
Adapting Lightweight Vision Language Models for Radiological Visual Question Answering	Jun 17, 2025	DiagnosticQuestion Answering	CodeCode Available	0
PoseGRAF: Geometric-Reinforced Adaptive Fusion for Monocular 3D Human Pose Estimation	Jun 17, 2025	3D Human Pose Estimation3D Pose Estimation	CodeCode Available	0
GRAM: A Generative Foundation Reward Model for Reward Generalization	Jun 17, 2025		CodeCode Available	1
QUEST: Quality-aware Semi-supervised Table Extraction for Business Documents	Jun 17, 2025	Pseudo LabelTable Extraction	CodeCode Available	0
Dataset distillation for memorized data: Soft labels can leak held-out teacher knowledge	Jun 17, 2025	Dataset DistillationMemorization	CodeCode Available	0