The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 16751–16800 of 474278 papers

Title	Date	Tasks	Status	Hype
Socratic-MCTS: Test-Time Visual Reasoning by Asking the Right Questions	Jun 10, 2025	Visual Reasoning	—Unverified	0
Diffuse and Disperse: Image Generation with Representation Regularization	Jun 10, 2025	Image Generationregression	—Unverified	0
An Adaptive Method Stabilizing Activations for Enhanced Generalization	Jun 10, 2025	image-classificationImage Classification	CodeCode Available	0
The interplay of robustness and generalization in quantum machine learning	Jun 10, 2025	Adversarial RobustnessQuantum Machine Learning	CodeCode Available	0
A Survey of Link Prediction in N-ary Knowledge Graphs	Jun 10, 2025	Knowledge GraphsLink Prediction	CodeCode Available	0
Modular Recurrence in Contextual MDPs for Universal Morphology Control	Jun 10, 2025	Deep Reinforcement LearningMuJoCo	—Unverified	0
Approaching Dialogue State Tracking via Aligning Speech Encoders and LLMs	Jun 10, 2025	Dialogue State Tracking	—Unverified	0
MD-ViSCo: A Unified Model for Multi-Directional Vital Sign Waveform Conversion	Jun 10, 2025		CodeCode Available	0
Data Augmentation For Small Object using Fast AutoAugment	Jun 10, 2025	Data AugmentationObject	—Unverified	0
Protriever: End-to-End Differentiable Protein Homology Search for Fitness Prediction	Jun 10, 2025	Protein DesignRetrieval	—Unverified	0
SakugaFlow: A Stagewise Illustration Framework Emulating the Human Drawing Process and Providing Interactive Tutoring for Novice Drawing Skills	Jun 10, 2025	AnatomyImage Generation	—Unverified	0
UD-KSL Treebank v1.3: A semi-automated framework for aligning XPOS-extracted units with UPOS tags	Jun 10, 2025	Dependency Parsing	—Unverified	0
NysAct: A Scalable Preconditioned Gradient Descent using Nystrom Approximation	Jun 10, 2025	Second-order methods	CodeCode Available	0
SDTagNet: Leveraging Text-Annotated Navigation Maps for Online HD Map Construction	Jun 10, 2025	Autonomous Vehicles	CodeCode Available	1
MOBODY: Model Based Off-Dynamics Offline Reinforcement Learning	Jun 10, 2025	Data Augmentationmodel	CodeCode Available	0
TableDreamer: Progressive and Weakness-guided Data Synthesis from Scratch for Table Instruction Tuning	Jun 10, 2025		CodeCode Available	0
Employing self-supervised learning models for cross-linguistic child speech maturity classification	Jun 10, 2025	Self-Supervised Learningvalid	CodeCode Available	0
Enhancing Reasoning Capabilities of Small Language Models with Blueprints and Prompt Template Search	Jun 10, 2025	GSM8KMath	—Unverified	0
Adapting Vision-Language Foundation Model for Next Generation Medical Ultrasound Image Analysis	Jun 10, 2025	Domain AdaptationLarge Language Model	CodeCode Available	1
Towards Secure and Private Language Models for Nuclear Power Plants	Jun 10, 2025	GPULanguage Modeling	—Unverified	0
Variational Autoencoder-Based Approach to Latent Feature Analysis on Efficient Representation of Power Load Monitoring Data	Jun 10, 2025	DecoderLoad Forecasting	—Unverified	0
Brevity is the soul of sustainability: Characterizing LLM response lengths	Jun 10, 2025	DecoderInference Optimization	CodeCode Available	0
Systematic and Efficient Construction of Quadratic Unconstrained Binary Optimization Forms for High-order and Dense Interactions	Jun 10, 2025	Combinatorial Optimization	—Unverified	0
Summarization for Generative Relation Extraction in the Microbiome Domain	Jun 10, 2025	RelationRelation Extraction	—Unverified	0
Spatial Transcriptomics Expression Prediction from Histopathology Based on Cross-Modal Mask Reconstruction and Contrastive Learning	Jun 10, 2025	Contrastive Learningwhole slide images	—Unverified	0
LeanTutor: A Formally-Verified AI Tutor for Mathematical Proofs	Jun 10, 2025	Large Language ModelMath	—Unverified	0
ORFS-agent: Tool-Using Agents for Chip Design Optimization	Jun 10, 2025	Bayesian Optimization	—Unverified	0
Single-Node Trigger Backdoor Attacks in Graph-Based Recommendation Systems	Jun 10, 2025	Backdoor AttackRecommendation Systems	—Unverified	0
SHIELD: Multi-task Multi-distribution Vehicle Routing Solver with Sparsity and Hierarchy	Jun 10, 2025	Decoder	—Unverified	0
A Survey on Large Language Models for Mathematical Reasoning	Jun 10, 2025	Answer GenerationMathematical Reasoning	—Unverified	0
Hybrid Reasoning for Perception, Explanation, and Autonomous Action in Manufacturing	Jun 10, 2025	Retrieval-augmented GenerationVision-Language-Action	—Unverified	0
How Much To Guide: Revisiting Adaptive Guidance in Classifier-Free Guidance Text-to-Vision Diffusion Models	Jun 10, 2025	DenoisingVideo Generation	—Unverified	0
Reinforcement Learning Teachers of Test Time Scaling	Jun 10, 2025	reinforcement-learningReinforcement Learning	—Unverified	0
How to Provably Improve Return Conditioned Supervised Learning?	Jun 10, 2025	Decision MakingOffline RL	—Unverified	0
Robust Evolutionary Multi-Objective Network Architecture Search for Reinforcement Learning (EMNAS-RL)	Jun 10, 2025	Autonomous DrivingReinforcement Learning (RL)	—Unverified	0
MasHost Builds It All: Autonomous Multi-Agent System Directed by Reinforcement Learning	Jun 10, 2025	Allgraph construction	—Unverified	0
Flow Matching Meets PDEs: A Unified Framework for Physics-Constrained Generation	Jun 10, 2025	Uncertainty Quantification	—Unverified	0
Exploration by Random Reward Perturbation	Jun 10, 2025	DiversityReinforcement Learning (RL)	—Unverified	0
MEMETRON: Metaheuristic Mechanisms for Test-time Response Optimization of Large Language Models	Jun 10, 2025	Reranking	—Unverified	0
Comparing human and LLM proofreading in L2 writing: Impact on lexical and syntactic features	Jun 10, 2025	Sentence	—Unverified	0
Boosting Gradient Leakage Attacks: Data Reconstruction in Realistic FL Settings	Jun 10, 2025	Federated Learning	—Unverified	0
DeepForm: Reasoning Large Language Model for Communication System Formulation	Jun 10, 2025	Language ModelingLanguage Modelling	—Unverified	0
TS-PIELM: Time-Stepping Physics-Informed Extreme Learning Machine Facilitates Soil Consolidation Analyses	Jun 10, 2025	Computational EfficiencyPhysics-informed machine learning	—Unverified	0
PerfTracker: Online Performance Troubleshooting for Large-scale Model Training in Production	Jun 10, 2025	DiagnosticGPU	—Unverified	0
Locating Tennis Ball Impact on the Racket in Real Time Using an Event Camera	Jun 10, 2025	Position	—Unverified	0
Convergence of Spectral Principal Paths: How Deep Networks Distill Linear Representations from Noisy Inputs	Jun 10, 2025	Fairness	—Unverified	0
A Probability-guided Sampler for Neural Implicit Surface Rendering	Jun 10, 2025	Surface Reconstruction	—Unverified	0
Orientation Matters: Making 3D Generative Models Orientation-Aligned	Jun 10, 2025	Object	—Unverified	0
ATAS: Any-to-Any Self-Distillation for Enhanced Open-Vocabulary Dense Prediction	Jun 10, 2025	object-detectionObject Detection	—Unverified	0
TraGraph-GS: Trajectory Graph-based Gaussian Splatting for Arbitrary Large-Scale Scene Rendering	Jun 10, 2025	Novel View Synthesis	—Unverified	0