The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5626–5650 of 474278 papers

Title	Date	Tasks	Status	Hype
SAM2MOT: A Novel Paradigm of Multi-Object Tracking by Segmentation	Apr 6, 2025	Multi-Object TrackingObject	CodeCode Available	2
UniToken: Harmonizing Multimodal Understanding and Generation through Unified Visual Encoding	Apr 6, 2025	Image Generation	CodeCode Available	2
VocalNet: Speech LLM with Multi-Token Prediction for Faster and High-Quality Generation	Apr 5, 2025		CodeCode Available	2
Investigating Affective Use and Emotional Well-being on ChatGPT	Apr 4, 2025	Privacy Preserving	CodeCode Available	2
RWKVTTS: Yet another TTS based on RWKV-7	Apr 4, 2025	Computational Efficiencytext-to-speech	CodeCode Available	2
MultiMed-ST: Large-scale Many-to-many Multilingual Medical Speech Translation	Apr 4, 2025	Machine TranslationTranslation	CodeCode Available	2
Agentic Knowledgeable Self-awareness	Apr 4, 2025	Decision Making	CodeCode Available	2
Mamba as a Bridge: Where Vision Foundation Models Meet Vision Language Models for Domain-Generalized Semantic Segmentation	Apr 4, 2025	Domain GeneralizationMamba	CodeCode Available	2
GPG: A Simple and Strong Reinforcement Learning Baseline for Model Reasoning	Apr 3, 2025	Reinforcement Learning (RL)	CodeCode Available	2
Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing	Apr 3, 2025	BenchmarkingLogical Reasoning	CodeCode Available	2
Sparse Autoencoders Learn Monosemantic Features in Vision-Language Models	Apr 3, 2025		CodeCode Available	2
GPTAQ: Efficient Finetuning-Free Quantization for Asymmetric Calibration	Apr 3, 2025	GPUQuantization	CodeCode Available	2
ZClip: Adaptive Spike Mitigation for LLM Pre-Training	Apr 3, 2025	Anomaly DetectionLarge Language Model	CodeCode Available	2
CrystalFormer-RL: Reinforcement Fine-Tuning for Materials Design	Apr 3, 2025	Band GapDielectric Constant	CodeCode Available	2
MegaMath: Pushing the Limits of Open Math Corpora	Apr 3, 2025	DiversityMath	CodeCode Available	2
Delineate Anything: Resolution-Agnostic Field Boundary Delineation on Satellite Imagery	Apr 3, 2025	Field Boundary DelineationInstance Segmentation	CodeCode Available	2
Exploration-Driven Generative Interactive Environments	Apr 3, 2025		CodeCode Available	2
Rethinking RL Scaling for Vision Language Models: A Transparent, From-Scratch Framework and Comprehensive Evaluation Scheme	Apr 3, 2025	Reinforcement Learning (RL)Visual Reasoning	CodeCode Available	2
Re-thinking Temporal Search for Long-Form Video Understanding	Apr 3, 2025	Computational EfficiencyForm	CodeCode Available	2
Scaling Video-Language Models to 10K Frames via Hierarchical Differential Distillation	Apr 3, 2025	Computational EfficiencyGPU	CodeCode Available	2
ILLUME+: Illuminating Unified MLLM with Dual Visual Tokenization and Diffusion Refinement	Apr 2, 2025	DecoderImage Generation	CodeCode Available	2
An Illusion of Progress? Assessing the Current State of Web Agents	Apr 2, 2025		CodeCode Available	2
SpaceR: Reinforcing MLLMs in Video Spatial Reasoning	Apr 2, 2025	MMESpatial Reasoning	CodeCode Available	2
Benchmarking Synthetic Tabular Data: A Multi-Dimensional Evaluation Framework	Apr 2, 2025	BenchmarkingSynthetic Data Generation	CodeCode Available	2
Efficient Federated Learning Tiny Language Models for Mobile Network Feature Prediction	Apr 2, 2025	Federated Learning	CodeCode Available	2