The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9151–9175 of 177340 papers

Title	Date	Tasks	Status	Hype	Score
FlightGPT: Towards Generalizable and Interpretable UAV Vision-and-Language Navigation with Vision-Language Models	May 19, 2025	Disaster ResponseVision and Language Navigation	CodeCode Available	2	5
GUI-explorer: Autonomous Exploration and Mining of Transition-aware Knowledge for GUI Agent	May 22, 2025		CodeCode Available	2	5
Ranked Entropy Minimization for Continual Test-Time Adaptation	May 22, 2025	Test-time Adaptation	CodeCode Available	2	5
Training Long-Context LLMs Efficiently via Chunk-wise Optimization	May 22, 2025	16kGPU	CodeCode Available	2	5
Training-Free Multi-Step Audio Source Separation	May 26, 2025	Audio Source SeparationDenoising	CodeCode Available	2	5
Divide and Conquer: Grounding LLMs as Efficient Decision-Making Agents via Offline Hierarchical Reinforcement Learning	May 26, 2025	Decision MakingHierarchical Reinforcement Learning	CodeCode Available	2	5
WeatherEdit: Controllable Weather Editing with 4D Gaussian Field	May 26, 2025	3D Generation3DGS	CodeCode Available	2	5
HyperMotion: DiT-Based Pose-Guided Human Image Animation of Complex Motions	May 29, 2025	Image AnimationVideo Generation	CodeCode Available	2	5
Hallo4: High-Fidelity Dynamic Portrait Animation via Direct Preference Optimization and Temporal Motion Modulation	May 29, 2025	Portrait AnimationVideo Alignment	CodeCode Available	2	5
TC-GS: A Faster Gaussian Splatting Module Utilizing Tensor Cores	May 30, 2025	3DGS	CodeCode Available	2	5
When Large Multimodal Models Confront Evolving Knowledge:Challenges and Pathways	May 30, 2025	Continual LearningImage Augmentation	CodeCode Available	2	5
ViStoryBench: Comprehensive Benchmark Suite for Story Visualization	May 30, 2025	Story Visualization	CodeCode Available	2	5
Hogwild! Inference: Parallel LLM Generation via Concurrent Attention	Apr 8, 2025		CodeCode Available	2	5
DualMap: Online Open-Vocabulary Semantic Mapping for Natural Language Navigation in Dynamic Changing Scenes	Jun 2, 2025	Natural Language QueriesNavigate	CodeCode Available	2	5
Savage-Dickey density ratio estimation with normalizing flows for Bayesian model comparison	Jun 4, 2025	Density Ratio Estimation	CodeCode Available	2	5
VideoMolmo: Spatio-Temporal Grounding Meets Pointing	Jun 5, 2025	Autonomous DrivingAutonomous Navigation	CodeCode Available	2	5
ORV: 4D Occupancy-centric Robot Video Generation	Jun 3, 2025	Video Generation	CodeCode Available	2	5
Autoregressive Semantic Visual Reconstruction Helps VLMs Understand Better	Jun 10, 2025	Image Generation	CodeCode Available	2	5
Thinking vs. Doing: Agents that Reason by Scaling Test-Time Interaction	Jun 9, 2025	Reinforcement Learning (RL)	CodeCode Available	2	5
Urban1960SatSeg: Unsupervised Semantic Segmentation of Mid-20^th century Urban Landscapes with Satellite Imageries	Jun 11, 2025	SegmentationSelf-Supervised Learning	CodeCode Available	2	5
UniPre3D: Unified Pre-training of 3D Point Cloud Models with Cross-Modal Gaussian Splatting	Jun 11, 2025	DiversityRepresentation Learning	CodeCode Available	2	5
CausalVQA: A Physically Grounded Causal Reasoning Benchmark for Video Models	Jun 11, 2025	counterfactualDescriptive	CodeCode Available	2	5
Language Modeling by Language Models	Jun 25, 2025	Code GenerationLanguage Modeling	CodeCode Available	2	5
PocketVina Enables Scalable and Highly Accurate Physically Valid Docking through Multi-Pocket Conditioning	Jun 24, 2025	BenchmarkingDrug Discovery	CodeCode Available	2	5
LightGaussian: Unbounded 3D Gaussian Compression with 15x Reduction and 200+ FPS	Nov 28, 2023	Knowledge DistillationNeRF	CodeCode Available	2	5