The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6501–6525 of 474278 papers

Title	Date	Tasks	Status	Hype
Text2midi: Generating Symbolic Music from Captions	Dec 21, 2024	Decoder	CodeCode Available	2
A Generalizable Anomaly Detection Method in Dynamic Graphs	Dec 21, 2024	Anomaly DetectionDiversity	CodeCode Available	2
Exploiting Multimodal Spatial-temporal Patterns for Video Object Tracking	Dec 20, 2024	MambaObject Tracking	CodeCode Available	2
Mapping the Mind of an Instruction-based Image Editing using SMILE	Dec 20, 2024	Autonomous Driving	CodeCode Available	2
Offline Reinforcement Learning for LLM Multi-Step Reasoning	Dec 20, 2024	GSM8KMath	CodeCode Available	2
FedRLHF: A Convergence-Guaranteed Federated Framework for Privacy-Preserving and Personalized RLHF	Dec 20, 2024	Privacy Preservingreinforcement-learning	CodeCode Available	2
PruneVid: Visual Token Pruning for Efficient Video Large Language Models	Dec 20, 2024	Video Understanding	CodeCode Available	2
MR-GDINO: Efficient Open-World Continual Object Detection	Dec 20, 2024	Continual Learningobject-detection	CodeCode Available	2
ChangeDiff: A Multi-Temporal Change Detection Data Generator with Flexible Text Prompts via Diffusion Model	Dec 20, 2024	Change Detection	CodeCode Available	2
XRAG: eXamining the Core -- Benchmarking Foundational Components in Advanced Retrieval-Augmented Generation	Dec 20, 2024	BenchmarkingDiagnostic	CodeCode Available	2
fluke: Federated Learning Utility frameworK for Experimentation and research	Dec 20, 2024	Federated Learning	CodeCode Available	2
Personalized Representation from Personalized Generation	Dec 20, 2024	Contrastive LearningImage Generation	CodeCode Available	2
PyBOP: A Python package for battery model optimisation and parameterisation	Dec 20, 2024		CodeCode Available	2
Collaborative Gym: A Framework for Enabling and Evaluating Human-Agent Collaboration	Dec 20, 2024	Human Agent Collaboration	CodeCode Available	2
Preventing Local Pitfalls in Vector Quantization via Optimal Transport	Dec 19, 2024	Image ReconstructionQuantization	CodeCode Available	2
DCTdiff: Intriguing Properties of Image Generative Modeling in the DCT Space	Dec 19, 2024		CodeCode Available	2
MMLU-CF: A Contamination-free Multi-task Language Understanding Benchmark	Dec 19, 2024	MMLUMultiple-choice	CodeCode Available	2
LeviTor: 3D Trajectory Oriented Image-to-Video Synthesis	Dec 19, 2024	Object	CodeCode Available	2
Can We Get Rid of Handcrafted Feature Extractors? SparseViT: Nonsemantics-Centered, Parameter-Efficient Image Manipulation Localization through Spare-Coding Transformer	Dec 19, 2024	Image ManipulationImage Manipulation Localization	CodeCode Available	2
Agent-SafetyBench: Evaluating the Safety of LLM Agents	Dec 19, 2024		CodeCode Available	2
Tests for model misspecification in simulation-based inference: from local distortions to global model checks	Dec 19, 2024	Anomaly Detectionmodel	CodeCode Available	2
Fietje: An open, efficient LLM for Dutch	Dec 19, 2024	Linguistic AcceptabilitySentiment Analysis	CodeCode Available	2
FlowAR: Scale-wise Autoregressive Image Generation Meets Flow Matching	Dec 19, 2024	Image GenerationPrediction	CodeCode Available	2
Next Patch Prediction for Autoregressive Visual Generation	Dec 19, 2024	Image GenerationPrediction	CodeCode Available	2
Learning charges and long-range interactions from energies and forces	Dec 19, 2024		CodeCode Available	2