The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5926–5950 of 177340 papers

Title	Date	Tasks	Status	Hype	Score
Momentum-GS: Momentum Gaussian Self-Distillation for High-Quality Large Scene Reconstruction	Dec 6, 2024	3D Reconstruction3D Scene Reconstruction	CodeCode Available	2	5
Segment This Thing: Foveated Tokenization for Efficient Point-Prompted Segmentation	Jun 10, 2025	FoveationImage Segmentation	CodeCode Available	2	5
Boost 3D Reconstruction using Diffusion-based Monocular Camera Calibration	Nov 26, 2024	3D ReconstructionCamera Calibration	CodeCode Available	2	5
Counting-Stars: A Multi-evidence, Position-aware, and Scalable Benchmark for Evaluating Long-Context Large Language Models	Mar 18, 2024	4kPosition	CodeCode Available	2	5
Flow-Guided Transformer for Video Inpainting	Aug 14, 2022	RetrievalVideo Inpainting	CodeCode Available	2	5
DISC-MedLLM: Bridging General Large Language Models and Real-World Medical Consultation	Aug 28, 2023	Knowledge Graphs	CodeCode Available	2	5
A Survey on Multimodal Benchmarks: In the Era of Large AI Models	Sep 21, 2024	BenchmarkingSurvey	CodeCode Available	2	5
SocialBench: Sociality Evaluation of Role-Playing Conversational Agents	Mar 20, 2024		CodeCode Available	2	5
Have Faith in Faithfulness: Going Beyond Circuit Overlap When Finding Model Mechanisms	Mar 26, 2024	Language Modelling	CodeCode Available	2	5
Unrecognizable Yet Identifiable: Image Distortion with Preserved Embeddings	Jan 26, 2024	Face RecognitionSecurity Studies	CodeCode Available	2	5
Convex Relaxation for Robust Vanishing Point Estimation in Manhattan World	May 7, 2025		CodeCode Available	2	5
Masked Modeling for Self-supervised Representation Learning on Vision and Beyond	Dec 31, 2023	Representation LearningSelf-Supervised Learning	CodeCode Available	2	5
MMA-DFER: MultiModal Adaptation of unimodal models for Dynamic Facial Expression Recognition in-the-wild	Apr 13, 2024	cross-modal alignmentDynamic Facial Expression Recognition	CodeCode Available	2	5
Neural Fields with Thermal Activations for Arbitrary-Scale Super-Resolution	Nov 29, 2023	Image Super-ResolutionSuper-Resolution	CodeCode Available	2	5
Pengi: An Audio Language Model for Audio Tasks	May 19, 2023	Audio captioningAudio Question Answering	CodeCode Available	2	5
EMO-SUPERB: An In-depth Look at Speech Emotion Recognition	Feb 20, 2024	Emotion RecognitionSelf-Supervised Learning	CodeCode Available	2	5
Latent Neural Operator for Solving Forward and Inverse PDE Problems	Jun 6, 2024	Computational EfficiencyGPU	CodeCode Available	2	5
EVA3D: Compositional 3D Human Generation from 2D Image Collections	Oct 10, 2022	DiversityNeRF	CodeCode Available	2	5
Tightly-Coupled LiDAR-IMU-Wheel Odometry with Online Calibration of a Kinematic Model for Skid-Steering Robots	Apr 3, 2024		CodeCode Available	2	5
CMGAN: Conformer-Based Metric-GAN for Monaural Speech Enhancement	Sep 22, 2022	Audio Super-ResolutionAutomatic Speech Recognition	CodeCode Available	2	5
Progressive Pretext Task Learning for Human Trajectory Prediction	Jul 16, 2024	Knowledge DistillationPrediction	CodeCode Available	2	5
Natural Language Reinforcement Learning	Nov 21, 2024	Decision Makingreinforcement-learning	CodeCode Available	2	5
Deep Learning Based Automatic Modulation Recognition: Models, Datasets, and Challenges	Jul 20, 2022	Automatic Modulation RecognitionDeep Learning	CodeCode Available	2	5
Robust Human Matting via Semantic Guidance	Oct 11, 2022	Image MattingSegmentation	CodeCode Available	2	5
InsightBench: Evaluating Business Analytics Agents Through Multi-Step Insight Generation	Jul 8, 2024		CodeCode Available	2	5