The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7876–7900 of 177340 papers

Title	Date	Tasks	Status	Hype	Score
MOSEL: 950,000 Hours of Speech Data for Open-Source Speech Foundation Model Training on EU Languages	Oct 1, 2024	Automatic Speech Recognitionspeech-recognition	CodeCode Available	2	5
ColorMNet: A Memory-based Deep Spatial-Temporal Feature Propagation Network for Video Colorization	Apr 9, 2024	Colorization	CodeCode Available	2	5
KVQ: Kwai Video Quality Assessment for Short-form Videos	Feb 11, 2024	FormVideo Quality Assessment	CodeCode Available	2	5
MedPromptX: Grounded Multimodal Prompting for Chest X-ray Diagnosis	Mar 22, 2024	Medical DiagnosisMedical Visual Question Answering	CodeCode Available	2	5
On Embeddings for Numerical Features in Tabular Deep Learning	Mar 10, 2022	Deep Learning	CodeCode Available	2	5
3D Vision with Transformers: A Survey	Aug 8, 2022	Pose EstimationSurvey	CodeCode Available	2	5
DSVT: Dynamic Sparse Voxel Transformer with Rotated Sets	Jan 15, 2023	3D Object Detectionobject-detection	CodeCode Available	2	5
Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small World graphs	Mar 30, 2016		CodeCode Available	2	5
How to Merge Your Multimodal Models Over Time?	Dec 9, 2024		CodeCode Available	2	5
PIXIU: A Large Language Model, Instruction Data and Evaluation Benchmark for Finance	Jun 8, 2023	Conversational Question AnsweringLanguage Modeling	CodeCode Available	2	5
DS-1000: A Natural and Reliable Benchmark for Data Science Code Generation	Nov 18, 2022	Code GenerationMemorization	CodeCode Available	2	5
Luminance-GS: Adapting 3D Gaussian Splatting to Challenging Lighting Conditions with View-Adaptive Curve Adjustment	Apr 2, 2025	3DGSNeRF	CodeCode Available	2	5
MM-IFEngine: Towards Multimodal Instruction Following	Apr 10, 2025	Instruction Following	CodeCode Available	2	5
MoFE-Time: Mixture of Frequency Domain Experts for Time-Series Forecasting Models	Jul 9, 2025	Mixture-of-ExpertsTime Series	CodeCode Available	2	5
Animal Avatars: Reconstructing Animatable 3D Animals from Casual Videos	Mar 25, 2024	3D ReconstructionAnimal Pose Estimation	CodeCode Available	2	5
CFBench: A Comprehensive Constraints-Following Benchmark for LLMs	Aug 2, 2024		CodeCode Available	2	5
Maintaining Plasticity in Deep Continual Learning	Jun 23, 2023	Binary ClassificationContinual Learning	CodeCode Available	2	5
Text-Only Training for Image Captioning using Noise-Injected CLIP	Nov 1, 2022	DecoderImage Captioning	CodeCode Available	2	5
DOCBENCH: A Benchmark for Evaluating LLM-based Document Reading Systems	Jul 15, 2024	Language ModellingLarge Language Model	CodeCode Available	2	5
Leveraging Temporal Contextualization for Video Action Recognition	Apr 15, 2024	Action RecognitionTemporal Action Localization	CodeCode Available	2	5
Towards Building Text-To-Speech Systems for the Next Billion Users	Nov 17, 2022	DiversitySpeech Synthesis	CodeCode Available	2	5
FlashSloth : Lightning Multimodal Large Language Models via Embedded Visual Compression	Jan 1, 2025	Descriptive	CodeCode Available	2	5
u-HuBERT: Unified Mixed-Modal Speech Pretraining And Zero-Shot Transfer to Unlabeled Modality	Jul 14, 2022	Speaker Verificationspeech-recognition	CodeCode Available	2	5
Monocular 3D Object Detection with Depth from Motion	Jul 26, 2022	3D Object DetectionDepth Estimation	CodeCode Available	2	5
SelfCheckGPT: Zero-Resource Black-Box Hallucination Detection for Generative Large Language Models	Mar 15, 2023	Fact CheckingHallucination	CodeCode Available	2	5