The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2001–2025 of 661570 papers

Title	Date	Tasks	Status	Hype
Large Models for Time Series and Spatio-Temporal Data: A Survey and Outlook	Oct 16, 2023	Time SeriesTime Series Analysis	CodeCode Available	4
4D Gaussian Splatting for Real-Time Dynamic Scene Rendering	Oct 12, 2023	Dynamic ReconstructionGPU	CodeCode Available	4
An Empirical Study of Instruction-tuning Large Language Models in Chinese	Oct 11, 2023		CodeCode Available	4
3D TransUNet: Advancing Medical Image Segmentation through Vision Transformers	Oct 11, 2023	DecoderImage Segmentation	CodeCode Available	4
SWE-bench: Can Language Models Resolve Real-World GitHub Issues?	Oct 10, 2023	Bug fixingCode Generation	CodeCode Available	4
OpenWebMath: An Open Dataset of High-Quality Mathematical Web Text	Oct 10, 2023		CodeCode Available	4
Language Model Beats Diffusion -- Tokenizer is Key to Visual Generation	Oct 9, 2023	Action RecognitionImage Generation	CodeCode Available	4
Retrieval-Generation Synergy Augmented Large Language Models	Oct 8, 2023	Question AnsweringRetrieval	CodeCode Available	4
Latent Consistency Models: Synthesizing High-Resolution Images with Few-Step Inference	Oct 6, 2023	GPUImage Generation	CodeCode Available	4
TimeGPT-1	Oct 5, 2023	Deep LearningTime Series	CodeCode Available	4
Kandinsky: an Improved Text-to-Image Synthesis with Image Prior and Latent Diffusion	Oct 5, 2023	Image GenerationText to Image Generation	CodeCode Available	4
Time-LLM: Time Series Forecasting by Reprogramming Large Language Models	Oct 3, 2023	Time SeriesTime Series Forecasting	CodeCode Available	4
LanguageBind: Extending Video-Language Pretraining to N-modality by Language-based Semantic Alignment	Oct 3, 2023	Audio ClassificationContrastive Learning	CodeCode Available	4
PixArt-α: Fast Training of Diffusion Transformer for Photorealistic Text-to-Image Synthesis	Sep 30, 2023	GPU	CodeCode Available	4
Guiding Instruction-based Image Editing via Multimodal Large Language Models	Sep 29, 2023	Image ManipulationResponse Generation	CodeCode Available	4
DreamGaussian: Generative Gaussian Splatting for Efficient 3D Content Creation	Sep 28, 2023	3D Generation	CodeCode Available	4
Efficient Post-training Quantization with FP8 Formats	Sep 26, 2023	image-classificationImage Classification	CodeCode Available	4
TradeMaster: A Holistic Quantitative Trading Platform Empowered by Reinforcement Learning	Sep 26, 2023		CodeCode Available	4
DeepSpeed Ulysses: System Optimizations for Enabling Training of Extreme Long Sequence Transformer Models	Sep 25, 2023	Language ModellingLarge Language Model	CodeCode Available	4
Safurai 001: New Qualitative Approach for Code LLM Evaluation	Sep 20, 2023	Language ModelingLanguage Modelling	CodeCode Available	4
Baichuan 2: Open Large-scale Language Models	Sep 19, 2023	Feature EngineeringGSM8K	CodeCode Available	4
Generating and Imputing Tabular Data via Diffusion and Flow-based Gradient-Boosted Trees	Sep 18, 2023	GPUImputation	CodeCode Available	4
ChainForge: A Visual Toolkit for Prompt Engineering and LLM Hypothesis Testing	Sep 17, 2023	Model SelectionPrompt Engineering	CodeCode Available	4
Optimize Weight Rounding via Signed Gradient Descent for the Quantization of LLMs	Sep 11, 2023	Quantization	CodeCode Available	4
Advancing Parsimonious Deep Learning Weather Prediction using the HEALPix Mesh	Sep 11, 2023	Deep Learning	CodeCode Available	4