The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1901–1950 of 177339 papers

Title	Date	Tasks	Status	Hype	Score
Aria Everyday Activities Dataset	Feb 20, 2024		CodeCode Available	4	5
QwenLong-L1: Towards Long-Context Large Reasoning Models with Reinforcement Learning	May 23, 2025	Question AnsweringReinforcement Learning (RL)	CodeCode Available	4	5
Distilling Tiny and Ultra-fast Deep Neural Networks for Autonomous Navigation on Nano-UAVs	Jul 17, 2024	Autonomous NavigationCollision Avoidance	CodeCode Available	4	5
A-MEM: Agentic Memory for LLM Agents	Feb 17, 2025	Large Language Model	CodeCode Available	4	5
MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations	Jun 13, 2024	3D visual groundingAttribute	CodeCode Available	4	5
FILM: Frame Interpolation for Large Motion	Feb 10, 2022	Optical Flow EstimationVideo Frame Interpolation	CodeCode Available	4	5
WorldVLA: Towards Autoregressive Action World Model	Jun 26, 2025	Action Generationmodel	CodeCode Available	4	5
SuGaR: Surface-Aligned Gaussian Splatting for Efficient 3D Mesh Reconstruction and High-Quality Mesh Rendering	Nov 21, 2023		CodeCode Available	4	5
Ming-Lite-Uni: Advancements in Unified Architecture for Natural Multimodal Interaction	May 5, 2025	Image Generationmultimodal interaction	CodeCode Available	4	5
AnyGPT: Unified Multimodal LLM with Discrete Sequence Modeling	Feb 19, 2024	Language ModelingLanguage Modelling	CodeCode Available	4	5
Open Problems in Applied Deep Learning	Jan 26, 2023	AutoMLDeep Learning	CodeCode Available	4	5
ReAct: Synergizing Reasoning and Acting in Language Models	Oct 6, 2022	Decision MakingFact Verification	CodeCode Available	4	5
A Comprehensive Survey on Deep Clustering: Taxonomy, Challenges, and Future Directions	Jun 15, 2022	ClusteringDeep Clustering	CodeCode Available	4	5
Diffusion Models for Medical Image Analysis: A Comprehensive Survey	Nov 14, 2022	DenoisingMedical Image Analysis	CodeCode Available	4	5
LLM Maybe LongLM: Self-Extend LLM Context Window Without Tuning	Jan 2, 2024		CodeCode Available	4	5
Kolmogorov-Arnold Convolutions: Design Principles and Empirical Studies	Jul 1, 2024	image-classificationImage Classification	CodeCode Available	4	5
ChatGPT for Robotics: Design Principles and Model Abilities	Feb 20, 2023	Mathematical ReasoningPrompt Engineering	CodeCode Available	4	5
An Entropy-based Text Watermarking Detection Method	Mar 20, 2024		CodeCode Available	4	5
RepoAgent: An LLM-Powered Open-Source Framework for Repository-level Code Documentation Generation	Feb 26, 2024	Code Documentation GenerationCode Generation	CodeCode Available	4	5
MINIMA: Modality Invariant Image Matching	Dec 27, 2024		CodeCode Available	4	5
SparseDrive: End-to-End Autonomous Driving via Sparse Scene Representation	May 30, 2024	AttributeAutonomous Driving	CodeCode Available	4	5
Tower: An Open Multilingual Large Language Model for Translation-Related Tasks	Feb 27, 2024	Language ModelingLanguage Modelling	CodeCode Available	4	5
TrustLLM: Trustworthiness in Large Language Models	Jan 10, 2024	EthicsFairness	CodeCode Available	4	5
Null-text Inversion for Editing Real Images using Guided Diffusion Models	Nov 17, 2022	Image GenerationText-based Image Editing	CodeCode Available	4	5
GriTS: Grid table similarity metric for table structure recognition	Mar 23, 2022		CodeCode Available	4	5
3D Scene Generation: A Survey	May 8, 2025	Autonomous DrivingDiversity	CodeCode Available	4	5
LEAN-GitHub: Compiling GitHub LEAN repositories for a versatile LEAN prover	Jul 24, 2024	Automated Theorem ProvingMath	CodeCode Available	4	5
Chain-of-Thought Hub: A Continuous Effort to Measure Large Language Models' Reasoning Performance	May 26, 2023		CodeCode Available	4	5
AgentBench: Evaluating LLMs as Agents	Aug 7, 2023	Decision MakingInstruction Following	CodeCode Available	4	5
Semantic-SAM: Segment and Recognize Anything at Any Granularity	Jul 10, 2023	Image SegmentationSegmentation	CodeCode Available	4	5
4D Gaussian Splatting for Real-Time Dynamic Scene Rendering	Oct 12, 2023	Dynamic ReconstructionGPU	CodeCode Available	4	5
InstanceDiffusion: Instance-level Control for Image Generation	Feb 5, 2024	Conditional Text-to-Image SynthesisImage Generation	CodeCode Available	4	5
Depth Any Video with Scalable Synthetic Data	Oct 14, 2024	Depth Estimation	CodeCode Available	4	5
TabularARGN: A Flexible and Efficient Auto-Regressive Framework for Generating High-Fidelity Synthetic Data	Jan 21, 2025	FairnessImputation	CodeCode Available	4	5
Quality-aware Masked Diffusion Transformer for Enhanced Music Generation	May 24, 2024	DiversityMusic Generation	CodeCode Available	4	5
LET-3D-AP: Longitudinal Error Tolerant 3D Average Precision for Camera-Only 3D Detection	Jun 15, 2022	Depth EstimationObject Detection	CodeCode Available	4	5
Simple and Effective Masked Diffusion Language Models	Jun 11, 2024	Language ModelingLanguage Modelling	CodeCode Available	4	5
Sample-Efficient Alignment for LLMs	Nov 3, 2024	Thompson Sampling	CodeCode Available	4	5
PVUW 2024 Challenge on Complex Video Understanding: Methods and Results	Jun 24, 2024	SegmentationSemantic Segmentation	CodeCode Available	4	5
SeeSR: Towards Semantics-Aware Real-World Image Super-Resolution	Nov 27, 2023	Image Super-ResolutionSuper-Resolution	CodeCode Available	4	5
Sparse Tensor-based Point Cloud Attribute Compression	Apr 3, 2022	Attribute	CodeCode Available	4	5
WavCraft: Audio Editing and Generation with Large Language Models	Mar 14, 2024	In-Context Learning	CodeCode Available	4	5
Meta Audiobox Aesthetics: Unified Automatic Quality Assessment for Speech, Music, and Sound	Feb 7, 2025	Benchmarking	CodeCode Available	4	5
mPLUG-Owl2: Revolutionizing Multi-modal Large Language Model with Modality Collaboration	Nov 7, 2023	1 Image, 2*2 StitchingDecoder	CodeCode Available	4	5
Baize: An Open-Source Chat Model with Parameter-Efficient Tuning on Self-Chat Data	Apr 3, 2023	ChatbotLanguage Modeling	CodeCode Available	4	5
Video Seal: Open and Efficient Video Watermarking	Dec 12, 2024	Video CompressionVideo Editing	CodeCode Available	4	5
MeshAnything V2: Artist-Created Mesh Generation With Adjacent Mesh Tokenization	Aug 5, 2024		CodeCode Available	4	5
TimeGPT-1	Oct 5, 2023	Deep LearningTime Series	CodeCode Available	4	5
Let the Expert Stick to His Last: Expert-Specialized Fine-Tuning for Sparse Architectural Large Language Models	Jul 2, 2024	Mixture-of-Expertsparameter-efficient fine-tuning	CodeCode Available	4	5
ELEVATER: A Benchmark and Toolkit for Evaluating Language-Augmented Visual Models	Apr 19, 2022	FairnessFew-Shot Image Classification	CodeCode Available	4	5