The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2076–2100 of 661570 papers

Title	Date	Status
Confidence Calibration under Ambiguous Ground Truth	Mar 24, 2026	—Unverified
TreeTeaming: Autonomous Red-Teaming of Vision-Language Models via Hierarchical Strategy Exploration	Mar 24, 2026	—Unverified
ForestPrune: High-ratio Visual Token Compression for Video Multimodal Large Language Models via Spatial-Temporal Forest Modeling	Mar 24, 2026	—Unverified
From the AI Act to a European AI Agency: Completing the Union's Regulatory Architecture	Mar 24, 2026	—Unverified
Multilingual KokoroChat: A Multi-LLM Ensemble Translation Method for Creating a Multilingual Counseling Dialogue Dataset	Mar 24, 2026	—Unverified
When AVSR Meets Video Conferencing: Dataset, Degradation, and the Hidden Mechanism Behind Performance Collapse	Mar 24, 2026	—Unverified
EVA: Efficient Reinforcement Learning for End-to-End Video Agent	Mar 24, 2026	—Unverified
The EU AI Act and the Rights-based Approach to Technological Governance	Mar 24, 2026	—Unverified
Quality Over Clicks: Intrinsic Quality-Driven Iterative Reinforcement Learning for Cold-Start E-Commerce Query Suggestion	Mar 24, 2026	—Unverified
ProGRank: Probe-Gradient Reranking to Defend Dense-Retriever RAG from Corpus Poisoning	Mar 24, 2026	—Unverified
Caption Generation for Dongba Paintings via Prompt Learning and Semantic Fusion	Mar 24, 2026	—Unverified
Weak-PDE-Net: Discovering Open-Form PDEs via Differentiable Symbolic Networks and Weak Formulation	Mar 24, 2026	—Unverified
Cluster-Wise Spatio-Temporal Masking for Efficient Video-Language Pretraining	Mar 24, 2026	—Unverified
Privacy-Preserving EHR Data Transformation via Geometric Operators: A Human-AI Co-Design Technical Report	Mar 24, 2026	—Unverified
Set-Valued Prediction for Large Language Models with Feasibility-Aware Coverage Guarantees	Mar 24, 2026	—Unverified
Beyond Theoretical Bounds: Empirical Privacy Loss Calibration for Text Rewriting Under Local Differential Privacy	Mar 24, 2026	—Unverified
FCL-COD: Weakly Supervised Camouflaged Object Detection with Frequency-aware and Contrastive Learning	Mar 24, 2026	—Unverified
Where Experts Disagree, Models Fail: Detecting Implicit Legal Citations in French Court Decisions	Mar 24, 2026	—Unverified
DariMis: Harm-Aware Modeling for Dari Misinformation Detection on YouTube	Mar 24, 2026	—Unverified
JFTA-Bench: Evaluate LLM's Ability of Tracking and Analyzing Malfunctions Using Fault Trees	Mar 24, 2026	—Unverified
Can Graph Foundation Models Generalize Over Architecture?	Mar 24, 2026	—Unverified
Beyond Hate: Differentiating Uncivil and Intolerant Speech in Multimodal Content Moderation	Mar 24, 2026	—Unverified
VQ-Jarvis: Retrieval-Augmented Video Restoration Agent with Sharp Vision and Fast Thought	Mar 24, 2026	—Unverified
PaperVoyager : Building Interactive Web with Visual Language Models	Mar 24, 2026	—Unverified
On the use of Aggregation Operators to improve Human Identification using Dental Records	Mar 24, 2026	—Unverified