The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6526–6550 of 474278 papers

Title	Date	Status
Kardia-R1: Unleashing LLMs to Reason toward Understanding and Empathy for Emotional Support via Rubric-as-Judge Reinforcement Learning	Dec 2, 2025	CodeCode Available
A Large Scale Benchmark for Test Time Adaptation Methods in Medical Image Segmentation	Dec 2, 2025	CodeCode Available
Towards Unification of Hallucination Detection and Fact Verification for Large Language Models	Dec 2, 2025	CodeCode Available
Reasoning Path and Latent State Analysis for Multi-view Visual Spatial Reasoning: A Cognitive Science Perspective	Dec 2, 2025	CodeCode Available
SeeNav-Agent: Enhancing Vision-Language Navigation with Visual Prompt and Step-Level Policy Optimization	Dec 2, 2025	—Unverified
HouseLayout3D: A Benchmark and Training-Free Baseline for 3D Layout Estimation in the Wild	Dec 2, 2025	—Unverified
Multilingual Pretraining for Pixel Language Models	Dec 2, 2025	—Unverified
Evaluating LLMs on Sequential API Call Through Automated Test Generation	Dec 2, 2025	—Unverified
Hyperdimensional Probe: Decoding LLM Representations via Vector Symbolic Architectures	Dec 2, 2025	—Unverified
AutoSurvey2: Empowering Researchers with Next Level Automated Literature Surveys	Dec 2, 2025	CodeCode Available
TabTune: A Unified Library for Inference and Fine-Tuning Tabular Foundation Models	Dec 2, 2025	—Unverified
OpenREAD: Reinforced Open-Ended Reasoning for End-to-End Autonomous Driving with LLM-as-Critic	Dec 2, 2025	—Unverified
From Atomic to Composite: Reinforcement Learning Enables Generalization in Complementary Reasoning	Dec 2, 2025	—Unverified
WorldMM: Dynamic Multimodal Memory Agent for Long Video Reasoning	Dec 2, 2025	—Unverified
YingVideo-MV: Music-Driven Multi-Stage Video Generation	Dec 2, 2025	—Unverified
IACT: A Self-Organizing Recursive Model for General AI Agents: A Technical White Paper on the Architecture Behind kragent.ai	Dec 2, 2025	—Unverified
Hear What Matters! Text-conditioned Selective Video-to-Audio Generation	Dec 2, 2025	—Unverified
ReVSeg: Incentivizing the Reasoning Chain for Video Segmentation with Reinforcement Learning	Dec 2, 2025	—Unverified
Fast-Decoding Diffusion Language Models via Progress-Aware Confidence Schedules	Dec 2, 2025	—Unverified
In-Context Sync-LoRA for Portrait Video Editing	Dec 2, 2025	—Unverified
ViSAudio: End-to-End Video-Driven Binaural Spatial Audio Generation	Dec 2, 2025	—Unverified
MultiShotMaster: A Controllable Multi-Shot Video Generation Framework	Dec 2, 2025	—Unverified
MagicQuillV2: Precise and Interactive Image Editing with Layered Visual Cues	Dec 2, 2025	—Unverified
Astra: A Multi-Agent System for GPU Kernel Performance Optimization	Dec 2, 2025	CodeCode Available
Generative Action Tell-Tales: Assessing Human Motion in Synthesized Videos	Dec 2, 2025	—Unverified