The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5901–5925 of 474278 papers

Title	Date	Tasks	Status	Hype
SemEval-2025 Task 11: Bridging the Gap in Text-Based Emotion Detection	Mar 10, 2025		CodeCode Available	2
Chameleon: Fast-slow Neuro-symbolic Lane Topology Extraction	Mar 10, 2025	Autonomous DrivingScene Understanding	CodeCode Available	2
DistiLLM-2: A Contrastive Approach Boosts the Distillation of LLMs	Mar 10, 2025	Code GenerationInstruction Following	CodeCode Available	2
Boosting the Generalization and Reasoning of Vision Language Models with Curriculum Reinforcement Learning	Mar 10, 2025		CodeCode Available	2
YOLOMG: Vision-based Drone-to-Drone Detection with Appearance and Pixel-Level Motion Fusion	Mar 10, 2025		CodeCode Available	2
When Large Vision-Language Model Meets Large Remote Sensing Imagery: Coarse-to-Fine Text-Guided Token Pruning	Mar 10, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
FaceID-6M: A Large-Scale, Open-Source FaceID Customization Dataset	Mar 10, 2025		CodeCode Available	2
MedAgentsBench: Benchmarking Thinking Models and Agent Frameworks for Complex Medical Reasoning	Mar 10, 2025	BenchmarkingMedical Question Answering	CodeCode Available	2
AR-Diffusion: Asynchronous Video Generation with Auto-Regressive Diffusion	Mar 10, 2025	Video Generation	CodeCode Available	2
A Multimodal Benchmark Dataset and Model for Crop Disease Diagnosis	Mar 10, 2025	Question Answering	CodeCode Available	2
Seedream 2.0: A Native Chinese-English Bilingual Image Generation Foundation Model	Mar 10, 2025	Image DescriptionImage Generation	CodeCode Available	2
Agent models: Internalizing Chain-of-Action Generation into Reasoning models	Mar 9, 2025	Action GenerationReinforcement Learning (RL)	CodeCode Available	2
Similarity-Guided Layer-Adaptive Vision Transformer for UAV Tracking	Mar 9, 2025	Visual Tracking	CodeCode Available	2
DiffAtlas: GenAI-fying Atlas Segmentation via Image-Mask Diffusion	Mar 9, 2025	Image SegmentationMedical Image Segmentation	CodeCode Available	2
Axes that matter: PCA with a difference	Mar 9, 2025	regression	CodeCode Available	2
Learning Few-Step Diffusion Models by Trajectory Distribution Matching	Mar 9, 2025	Image GenerationText to Image Generation	CodeCode Available	2
Emulating Self-attention with Convolution for Efficient Image Super-Resolution	Mar 9, 2025	Computational EfficiencyImage Super-Resolution	CodeCode Available	2
CLIMB: Data Foundations for Large Scale Multimodal Clinical Foundation Models	Mar 9, 2025		CodeCode Available	2
DiffCLIP: Differential Attention Meets CLIP	Mar 9, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
RouterEval: A Comprehensive Benchmark for Routing LLMs to Explore Model-level Scaling Up in LLMs	Mar 8, 2025	Instruction FollowingMathematical Reasoning	CodeCode Available	2
USP: Unified Self-Supervised Pretraining for Image Generation and Understanding	Mar 8, 2025	Image GenerationRepresentation Learning	CodeCode Available	2
A Noise-Robust Turn-Taking System for Real-World Dialogue Robots: A Field Experiment	Mar 8, 2025	speech-recognitionSpeech Recognition	CodeCode Available	2
X2I: Seamless Integration of Multimodal Understanding into Diffusion Transformer via Attention Distillation	Mar 8, 2025	GPUImage Generation	CodeCode Available	2
Next Token Is Enough: Realistic Image Quality and Aesthetic Scoring with Multimodal Large Language Model	Mar 8, 2025	Image Quality AssessmentLanguage Modeling	CodeCode Available	2
Can Atomic Step Decomposition Enhance the Self-structured Reasoning of Multimodal Large Models?	Mar 8, 2025	Mathematical ReasoningMultimodal Reasoning	CodeCode Available	2