The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1526–1550 of 659983 papers

Title	Date	Tasks	Status	Hype
Symbolic Prompt Program Search: A Structure-Aware Approach to Efficient Compile-Time Prompt Optimization	Apr 2, 2024	RAGRetrieval	CodeCode Available	4
LLMs-as-Judges: A Comprehensive Survey on LLM-based Evaluation Methods	Dec 7, 2024		CodeCode Available	4
Multi-head Temporal Latent Attention	May 19, 2025	GPUspeech-recognition	CodeCode Available	4
OpenMathInstruct-1: A 1.8 Million Math Instruction Tuning Dataset	Feb 15, 2024	Arithmetic ReasoningGSM8K	CodeCode Available	4
A Survey on Video Diffusion Models	Oct 16, 2023	Image GenerationSurvey	CodeCode Available	4
MEDITRON-70B: Scaling Medical Pretraining for Large Language Models	Nov 27, 2023	ArticlesConditional Text Generation	CodeCode Available	4
Deep Residual Learning for Image Recognition	Dec 10, 2015	Classification	CodeCode Available	4
Multi-label Cluster Discrimination for Visual Representation Learning	Jul 24, 2024	Contrastive LearningImage-text Retrieval	CodeCode Available	4
Craw4LLM: Efficient Web Crawling for LLM Pretraining	Feb 19, 2025	10-shot image generation	CodeCode Available	4
Beyond Outlining: Heterogeneous Recursive Planning for Adaptive Long-form Writing with Language Models	Mar 11, 2025	FormInformation Retrieval	CodeCode Available	4
MiMo-VL Technical Report	Jun 4, 2025	Multimodal Reasoning	CodeCode Available	4
LightGlue: Local Feature Matching at Light Speed	Jun 23, 2023	3D ReconstructionCamera Pose Estimation	CodeCode Available	4
Catastrophic Forgetting in Deep Learning: A Comprehensive Taxonomy	Dec 16, 2023	Deep Learningimage-classification	CodeCode Available	4
FlowEdit: Inversion-Free Text-Based Editing Using Pre-Trained Flow Models	Dec 11, 2024		CodeCode Available	4
Deepfake Generation and Detection: A Benchmark and Survey	Mar 26, 2024	AttributeFace Generation	CodeCode Available	4
Easi3R: Estimating Disentangled Motion from DUSt3R Without Training	Mar 31, 2025	4D reconstructionCamera Pose Estimation	CodeCode Available	4
Pytorch-Wildlife: A Collaborative Deep Learning Framework for Conservation	May 21, 2024	Deep Learning	CodeCode Available	4
Agent Q: Advanced Reasoning and Learning for Autonomous AI Agents	Aug 13, 2024	Decision Making	CodeCode Available	4
InceptionNeXt: When Inception Meets ConvNeXt	Mar 29, 2023	Image ClassificationSemantic Segmentation	CodeCode Available	4
Neural Network Diffusion	Feb 20, 2024	Decoder	CodeCode Available	4
BioGPT: Generative Pre-trained Transformer for Biomedical Text Generation and Mining	Oct 19, 2022	Document ClassificationLanguage Modelling	CodeCode Available	4
Hierarchically Coherent Multivariate Mixture Networks	May 11, 2023	Computational EfficiencyTime Series	CodeCode Available	4
Self-Supervised Prompt Optimization	Feb 7, 2025		CodeCode Available	4
Mamba-FETrack: Frame-Event Tracking via State Space Model	Apr 28, 2024	GPUMamba	CodeCode Available	4
Accelerating Data Processing and Benchmarking of AI Models for Pathology	Feb 10, 2025	Benchmarking	CodeCode Available	4