The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2226–2250 of 661570 papers

Title	Date	Tasks	Status	Hype
A Survey on Occupancy Perception for Autonomous Driving: The Information Fusion Perspective	May 8, 2024	Autonomous DrivingAutonomous Vehicles	CodeCode Available	4
T2I-Adapter: Learning Adapters to Dig out More Controllable Ability for Text-to-Image Diffusion Models	Feb 16, 2023	Image GenerationStyle Transfer	CodeCode Available	4
Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding	Jun 5, 2023	Language ModelingLanguage Modelling	CodeCode Available	4
Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators	Mar 23, 2023	Image GenerationText-to-Video Generation	CodeCode Available	4
HarmBench: A Standardized Evaluation Framework for Automated Red Teaming and Robust Refusal	Feb 6, 2024	Red Teaming	CodeCode Available	4
MOFA-Video: Controllable Image Animation via Generative Motion Field Adaptions in Frozen Image-to-Video Diffusion Model	May 30, 2024	Image AnimationVideo Generation	CodeCode Available	4
Generalizable Humanoid Manipulation with 3D Diffusion Policies	Oct 14, 2024	Camera CalibrationPoint Cloud Segmentation	CodeCode Available	4
LongCite: Enabling LLMs to Generate Fine-grained Citations in Long-context QA	Sep 4, 2024	Question AnsweringSentence	CodeCode Available	4
No Pose, No Problem: Surprisingly Simple 3D Gaussian Splats from Sparse Unposed Images	Oct 31, 2024	3D ReconstructionGeneralizable Novel View Synthesis	CodeCode Available	4
Do LLMs Possess a Personality? Making the MBTI Test an Amazing Evaluation for Large Language Models	Jul 30, 2023	HallucinationPrompt Engineering	CodeCode Available	4
Multimodal Chain-of-Thought Reasoning in Language Models	Feb 2, 2023	HallucinationLanguage Modelling	CodeCode Available	4
Efficient Automated Deep Learning for Time Series Forecasting	May 11, 2022	AutoMLBayesian Optimization	CodeCode Available	4
SplaTAM: Splat, Track & Map 3D Gaussians for Dense RGB-D SLAM	Dec 4, 2023	Camera Pose EstimationNovel View Synthesis	CodeCode Available	4
Not what you've signed up for: Compromising Real-World LLM-Integrated Applications with Indirect Prompt Injection	Feb 23, 2023	Code CompletionComputer Security	CodeCode Available	4
Lean Workbook: A large-scale Lean problem set formalized from natural language math problems	Jun 6, 2024	Automated Theorem ProvingMath	CodeCode Available	4
GeoCalib: Learning Single-image Calibration with Geometric Optimization	Sep 10, 2024	3D geometryVisual Localization	CodeCode Available	4
ManimML: Communicating Machine Learning Architectures with Animation	Jun 29, 2023		CodeCode Available	4
Bench2Drive: Towards Multi-Ability Benchmarking of Closed-Loop End-To-End Autonomous Driving	Jun 6, 2024	Autonomous DrivingBench2Drive	CodeCode Available	4
TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching and Clap-Ranked Preference Optimization	Dec 30, 2024	Audio GenerationGPU	CodeCode Available	4
SQuARE: Sequential Question Answering Reasoning Engine for Enhanced Chain-of-Thought in Large Language Models	Feb 13, 2025	Question AnsweringRAG	CodeCode Available	4
Reasoning with Language Model is Planning with World Model	May 24, 2023	Language ModelingLanguage Modelling	CodeCode Available	4
Fine-Tuning Image-Conditional Diffusion Models is Easier than You Think	Sep 17, 2024	Conditional Image GenerationDepth Estimation	CodeCode Available	4
DocRes: A Generalist Model Toward Unifying Document Image Restoration Tasks	May 7, 2024	BinarizationDeblurring	CodeCode Available	4
PixArt-α: Fast Training of Diffusion Transformer for Photorealistic Text-to-Image Synthesis	Sep 30, 2023	GPU	CodeCode Available	4
Flamingo: a Visual Language Model for Few-Shot Learning	Apr 29, 2022	Few-Shot LearningGenerative Visual Question Answering	CodeCode Available	4