The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1451–1475 of 659983 papers

Title	Date	Tasks	Status	Hype
VideoChat-Flash: Hierarchical Compression for Long-Context Video Modeling	Dec 31, 2024	Memorization	CodeCode Available	4
OCRBench v2: An Improved Benchmark for Evaluating Large Multimodal Models on Visual Text Localization and Reasoning	Dec 31, 2024	BenchmarkingLogical Reasoning	CodeCode Available	4
TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching and Clap-Ranked Preference Optimization	Dec 30, 2024	Audio GenerationGPU	CodeCode Available	4
Training Software Engineering Agents and Verifiers with SWE-Gym	Dec 30, 2024	Language ModelingLanguage Modelling	CodeCode Available	4
MINIMA: Modality Invariant Image Matching	Dec 27, 2024		CodeCode Available	4
The Thousand Brains Project: A New Paradigm for Sensorimotor Intelligence	Dec 24, 2024	Continual Learning	CodeCode Available	4
LLM4AD: A Platform for Algorithm Design with Large Language Model	Dec 23, 2024	Language ModelingLanguage Modelling	CodeCode Available	4
Dora: Sampling and Benchmarking for 3D Shape Variational Auto-Encoders	Dec 23, 2024	3D Shape ModelingBenchmarking	CodeCode Available	4
OpenEMMA: Open-Source Multimodal Model for End-to-End Autonomous Driving	Dec 19, 2024	Autonomous Driving	CodeCode Available	4
Human-Humanoid Robots Cross-Embodiment Behavior-Skill Transfer Using Decomposed Adversarial Learning from Demonstration	Dec 19, 2024	Human-Object Interaction Detectionmotion retargeting	CodeCode Available	4
Dimension Reduction with Locally Adjusted Graphs	Dec 19, 2024	Dimensionality Reduction	CodeCode Available	4
SocialED: A Python Library for Social Event Detection	Dec 18, 2024	CPUEvent Detection	CodeCode Available	4
Autoregressive Video Generation without Vector Quantization	Dec 18, 2024	Image GenerationPrediction	CodeCode Available	4
Thinking in Space: How Multimodal Large Language Models See, Remember, and Recall Spaces	Dec 18, 2024	Question AnsweringSpatial Reasoning	CodeCode Available	4
Neural general circulation models optimized to predict satellite-based precipitation observations	Dec 16, 2024		CodeCode Available	4
SepLLM: Accelerate Large Language Models by Compressing One Segment into One Separator	Dec 16, 2024	GSM8KLanguage Modeling	CodeCode Available	4
DisCo-DSO: Coupling Discrete and Continuous Optimization for Efficient Generative Design in Hybrid Spaces	Dec 15, 2024	Symbolic Regression	CodeCode Available	4
Towards Effective, Efficient and Unsupervised Social Event Detection in the Hyperbolic Space	Dec 14, 2024	Event Detection	CodeCode Available	4
Gaze-LLE: Gaze Target Estimation via Large-Scale Learned Encoders	Dec 12, 2024	Gaze Target Estimation	CodeCode Available	4
Video Seal: Open and Efficient Video Watermarking	Dec 12, 2024	Video CompressionVideo Editing	CodeCode Available	4
Hidden Biases of End-to-End Driving Datasets	Dec 12, 2024	Bench2DriveCARLA Leaderboard 2.0	CodeCode Available	4
MOS: Model Surgery for Pre-Trained Model-Based Class-Incremental Learning	Dec 12, 2024	class-incremental learningClass Incremental Learning	CodeCode Available	4
FlowEdit: Inversion-Free Text-Based Editing Using Pre-Trained Flow Models	Dec 11, 2024		CodeCode Available	4
SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints	Dec 10, 2024	4D reconstructionVideo Generation	CodeCode Available	4
SAT: Dynamic Spatial Aptitude Training for Multimodal Language Models	Dec 10, 2024	Action RecognitionSpatial Reasoning	CodeCode Available	4