The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7776–7800 of 474278 papers

Title	Date	Status
Decoupling Augmentation Bias in Prompt Learning for Vision-Language Models	Nov 5, 2025	CodeCode Available
TripleWin: Fixed-Point Equilibrium Pricing for Data-Model Coupled Markets	Nov 5, 2025	CodeCode Available
miniF2F-Lean Revisited: Reviewing Limitations and Charting a Path Forward	Nov 5, 2025	CodeCode Available
CudaForge: An Agent Framework with Hardware Feedback for CUDA Kernel Optimization	Nov 5, 2025	CodeCode Available
Computational Imaging Meets LLMs: Zero-Shot IDH Mutation Prediction in Brain Gliomas	Nov 5, 2025	CodeCode Available
An Augmentation Overlap Theory of Contrastive Learning	Nov 5, 2025	CodeCode Available
C3-Diff: Super-resolving Spatial Transcriptomics via Cross-modal Cross-content Contrastive Diffusion Modelling	Nov 4, 2025	CodeCode Available
DiffSwap++: 3D Latent-Controlled Diffusion for Identity-Preserving Face Swapping	Nov 4, 2025	CodeCode Available
Seeing Across Time and Views: Multi-Temporal Cross-View Learning for Robust Video Person Re-Identification	Nov 4, 2025	CodeCode Available
Object Detection as an Optional Basis: A Graph Matching Network for Cross-View UAV Localization	Nov 4, 2025	CodeCode Available
GS-Verse: Mesh-based Gaussian Splatting for Physics-aware Interaction in Virtual Reality	Nov 4, 2025	—Unverified
LTD-Bench: Evaluating Large Language Models by Letting Them Draw	Nov 4, 2025	—Unverified
KAO: Kernel-Adaptive Optimization in Diffusion for Satellite Image	Nov 4, 2025	—Unverified
CostBench: Evaluating Multi-Turn Cost-Optimal Planning and Adaptation in Dynamic Environments for LLM Tool-Use Agents	Nov 4, 2025	—Unverified
TWIST2: Scalable, Portable, and Holistic Humanoid Data Collection System	Nov 4, 2025	—Unverified
Activation Transport Operators	Nov 4, 2025	—Unverified
SmartWilds: Multimodal Wildlife Monitoring Dataset	Nov 4, 2025	—Unverified
A Foundation Model for Brain MRI with Dynamic Modality Integration	Nov 4, 2025	CodeCode Available
LAWCAT: Efficient Distillation from Quadratic to Linear Attention with Convolution across Tokens for Long Context Modeling	Nov 4, 2025	CodeCode Available
Uniworld-V2: Reinforce Image Editing with Diffusion Negative-aware Finetuning and MLLM Implicit Feedback	Nov 4, 2025	—Unverified
SAND-Math: Using LLMs to Generate Novel, Difficult and Useful Mathematics Questions and Answers	Nov 4, 2025	—Unverified
Genie Envisioner: A Unified World Foundation Platform for Robotic Manipulation	Nov 4, 2025	—Unverified
FlowRL: Matching Reward Distributions for LLM Reasoning	Nov 4, 2025	—Unverified
MultiSoundGen: Video-to-Audio Generation for Multi-Event Scenarios via SlowFast Contrastive Audio-Visual Pretraining and Direct Preference Optimization	Nov 4, 2025	—Unverified
Revisiting Long-context Modeling from Context Denoising Perspective	Nov 4, 2025	—Unverified