The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7426–7450 of 474278 papers

Title	Date	Status
VADB: A Large-Scale Video Aesthetic Database with Professional and Multi-Dimensional Annotations	Nov 13, 2025	CodeCode Available
LPLC: A Dataset for License Plate Legibility Classification	Nov 13, 2025	CodeCode Available
Rethinking Text-to-SQL: Dynamic Multi-turn SQL Interaction for Real-world Database Exploration	Nov 13, 2025	CodeCode Available
Torch-Uncertainty: A Deep Learning Framework for Uncertainty Quantification	Nov 13, 2025	CodeCode Available
Beyond Elicitation: Provision-based Prompt Optimization for Knowledge-Intensive Tasks	Nov 13, 2025	CodeCode Available
Panda: Test-Time Adaptation with Negative Data Augmentation	Nov 13, 2025	CodeCode Available
SemanticVLA: Semantic-Aligned Sparsification and Enhancement for Efficient Robotic Manipulation	Nov 13, 2025	CodeCode Available
DESS: DeBERTa Enhanced Syntactic-Semantic Aspect Sentiment Triplet Extraction	Nov 13, 2025	CodeCode Available
SSR: Socratic Self-Refine for Large Language Model Reasoning	Nov 13, 2025	CodeCode Available
Towards Personalized Treatment Plan: Geometrical Model-Agnostic Approach to Counterfactual Explanations	Nov 13, 2025	CodeCode Available
Bias-Restrained Prefix Representation Finetuning for Mathematical Reasoning	Nov 13, 2025	CodeCode Available
PISanitizer: Preventing Prompt Injection to Long-Context LLMs via Prompt Sanitization	Nov 13, 2025	CodeCode Available
IDOL: Meeting Diverse Distribution Shifts with Prior Physics for Tropical Cyclone Multi-Task Estimation	Nov 13, 2025	CodeCode Available
VisualMimic: Visual Humanoid Loco-Manipulation via Motion Tracking and Generation	Nov 13, 2025	—Unverified
The Markovian Thinker: Architecture-Agnostic Linear Scaling of Reasoning	Nov 13, 2025	—Unverified
PressTrack-HMR: Pressure-Based Top-Down Multi-Person Global Human Mesh Recovery	Nov 13, 2025	CodeCode Available
WaterMod: Modular Token-Rank Partitioning for Probability-Balanced LLM Watermarking	Nov 13, 2025	CodeCode Available
LISA: A Layer-wise Integration and Suppression Approach for Hallucination Mitigation in Multimodal Large Language Models	Nov 13, 2025	CodeCode Available
FHIR-AgentBench: Benchmarking LLM Agents for Realistic Interoperable EHR Question Answering	Nov 13, 2025	CodeCode Available
Compensating Distribution Drifts in Class-incremental Learning of Pre-trained Vision Transformers	Nov 13, 2025	CodeCode Available
MultiTab: A Scalable Foundation for Multitask Learning on Tabular Data	Nov 13, 2025	CodeCode Available
fastbmRAG: A Fast Graph-Based RAG Framework for Efficient Processing of Large-Scale Biomedical Literature	Nov 13, 2025	CodeCode Available
From Static Structures to Ensembles: Studying and Harnessing Protein Structure Tokenization	Nov 13, 2025	CodeCode Available
When Eyes and Ears Disagree: Can MLLMs Discern Audio-Visual Confusion?	Nov 13, 2025	CodeCode Available
MatchAttention: Matching the Relative Positions for High-Resolution Cross-View Matching	Nov 13, 2025	CodeCode Available