The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8076–8100 of 474278 papers

Title	Date	Tasks	Status	Hype
VFIMamba: Video Frame Interpolation with State Space Models	Jul 2, 2024	2k4k	CodeCode Available	2
Boosting Consistency in Story Visualization with Rich-Contextual Conditional Diffusion Models	Jul 2, 2024	Story Visualization	CodeCode Available	2
Safety-Driven Deep Reinforcement Learning Framework for Cobots: A Sim2Real Approach	Jul 2, 2024	Deep Reinforcement Learning	CodeCode Available	2
SeFlow: A Self-Supervised Scene Flow Method in Autonomous Driving	Jul 1, 2024	Autonomous DrivingAutonomous Vehicles	CodeCode Available	2
Benchmarking Predictive Coding Networks -- Made Simple	Jul 1, 2024	Benchmarking	CodeCode Available	2
Centerline Boundary Dice Loss for Vascular Segmentation	Jul 1, 2024	Segmentation	CodeCode Available	2
E.T. the Exceptional Trajectories: Text-to-camera-trajectory generation with character awareness	Jul 1, 2024	3D Generation	CodeCode Available	2
SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection	Jul 1, 2024	Objectobject-detection	CodeCode Available	2
AutoFlow: Automated Workflow Generation for Large Language Model Agents	Jul 1, 2024	AI AgentLanguage Modeling	CodeCode Available	2
RegMix: Data Mixture as Regression for Language Model Pre-training	Jul 1, 2024	Common Sense ReasoningLanguage Modeling	CodeCode Available	2
DCoM: Active Learning for All Learners	Jul 1, 2024	Active LearningAll	CodeCode Available	2
DiscoveryBench: Towards Data-Driven Discovery with Large Language Models	Jul 1, 2024	Code GenerationSociology	CodeCode Available	2
FairMedFM: Fairness Benchmarking for Medical Imaging Foundation Models	Jul 1, 2024	BenchmarkingFairness	CodeCode Available	2
KV Cache Compression, But What Must We Give in Return? A Comprehensive Benchmark of Long Context Capable Approaches	Jul 1, 2024	Book summarizationQuantization	CodeCode Available	2
IBSEN: Director-Actor Agent Collaboration for Controllable and Interactive Drama Script Generation	Jul 1, 2024	Language ModelingLanguage Modelling	CodeCode Available	2
Improving Diffusion Inverse Problem Solving with Decoupled Noise Annealing	Jul 1, 2024	DenoisingImage Restoration	CodeCode Available	2
Robust and Reliable Early-Stage Website Fingerprinting Attacks via Spatial-Temporal Distribution Analysis	Jul 1, 2024	Contrastive LearningData Augmentation	CodeCode Available	2
DiffIR2VR-Zero: Zero-Shot Video Restoration with Diffusion-based Image Restoration Models	Jul 1, 2024	DenoisingImage Restoration	CodeCode Available	2
Summary of a Haystack: A Challenge to Long-Context LLMs and RAG Systems	Jul 1, 2024	RAG	CodeCode Available	2
MMLongBench-Doc: Benchmarking Long-context Document Understanding with Visualizations	Jul 1, 2024	Benchmarkingdocument understanding	CodeCode Available	2
FORA: Fast-Forward Caching in Diffusion Transformer Acceleration	Jul 1, 2024	Denoising	CodeCode Available	2
GalLoP: Learning Global and Local Prompts for Vision-Language Models	Jul 1, 2024	DiversityDomain Generalization	CodeCode Available	2
Learning 3D Gaussians for Extremely Sparse-View Cone-Beam CT Reconstruction	Jul 1, 2024	CT Reconstruction	CodeCode Available	2
We-Math: Does Your Large Multimodal Model Achieve Human-like Mathematical Reasoning?	Jul 1, 2024	MathMathematical Reasoning	CodeCode Available	2
Equivariant Diffusion Policy	Jul 1, 2024	Imitation LearningRobot Manipulation	CodeCode Available	2