The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6926–6950 of 474278 papers

Title	Date	Status
DBGroup: Dual-Branch Point Grouping for Weakly Supervised 3D Semantic Instance Segmentation	Nov 25, 2025	CodeCode Available
X-ReID: Multi-granularity Information Interaction for Video-Based Visible-Infrared Person Re-Identification	Nov 25, 2025	CodeCode Available
Provably Outlier-resistant Semi-parametric Regression for Transferable Calibration of Low-cost Air-quality Sensors	Nov 25, 2025	CodeCode Available
Distilling Cross-Modal Knowledge via Feature Disentanglement	Nov 25, 2025	CodeCode Available
Multi-Context Fusion Transformer for Pedestrian Crossing Intention Prediction in Urban Environments	Nov 25, 2025	CodeCode Available
iRadioDiff: Physics-Informed Diffusion Model for Indoor Radio Map Construction and Localization	Nov 25, 2025	CodeCode Available
EM2LDL: A Multilingual Speech Corpus for Mixed Emotion Recognition through Label Distribution Learning	Nov 25, 2025	CodeCode Available
Learning Subgroups with Maximum Treatment Effects without Causal Heuristics	Nov 25, 2025	CodeCode Available
Zoo3D: Zero-Shot 3D Object Detection at Scene Level	Nov 25, 2025	CodeCode Available
Video-LMM Post-Training: A Deep Dive into Video Reasoning with Large Multimodal Models	Nov 25, 2025	CodeCode Available
LiveVectorLake: A Real-Time Versioned Knowledge Base Architecture for Streaming Vector Updates and Temporal Retrieval	Nov 24, 2025	CodeCode Available
Deep Research: A Systematic Survey	Nov 24, 2025	—Unverified
PropensityBench: Evaluating Latent Safety Risks in Large Language Models via an Agentic Approach	Nov 24, 2025	CodeCode Available
LLMs for Low-Resource Dialect Translation Using Context-Aware Prompting: A Case Study on Sylheti	Nov 24, 2025	CodeCode Available
Masked Autoencoder Joint Learning for Robust Spitzoid Tumor Classification	Nov 24, 2025	CodeCode Available
BackdoorVLM: A Benchmark for Backdoor Attacks on Vision-Language Models	Nov 24, 2025	CodeCode Available
MedBridge: Bridging Foundation Vision-Language Models to Medical Image Diagnosis in Chest X-Ray	Nov 24, 2025	CodeCode Available
How does Alignment Enhance LLMs' Multilingual Capabilities? A Language Neurons Perspective	Nov 24, 2025	—Unverified
SlimInfer: Accelerating Long-Context LLM Inference via Dynamic Token Pruning	Nov 24, 2025	CodeCode Available
Do LLMs Feel? Teaching Emotion Recognition with Prompts, Retrieval, and Curriculum Learning	Nov 24, 2025	—Unverified
Live-SWE-agent: Can Software Engineering Agents Self-Evolve on the Fly?	Nov 24, 2025	—Unverified
Reasoning via Video: The First Evaluation of Video Models' Reasoning Abilities through Maze-Solving Tasks	Nov 24, 2025	—Unverified
Upsample Anything: A Simple and Hard to Beat Baseline for Feature Upsampling	Nov 24, 2025	—Unverified
Cognitive Foundations for Reasoning and Their Manifestation in LLMs	Nov 24, 2025	—Unverified
Beyond Multiple Choice: Verifiable OpenQA for Robust Vision-Language RFT	Nov 24, 2025	—Unverified