The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 659983 papers

Title	Date	Status
Reliable Classroom AI via Neuro-Symbolic Multimodal Reasoning	Mar 24, 2026	—Unverified
It Takes Two: A Duet of Periodicity and Directionality for Burst Flicker Removal	Mar 24, 2026	—Unverified
PhotoAgent: A Robotic Photographer with Spatial and Aesthetic Understanding	Mar 24, 2026	—Unverified
Span Modeling for Idiomaticity and Figurative Language Detection with Span Contrastive Loss	Mar 24, 2026	—Unverified
Universal and efficient graph neural networks with dynamic attention for machine learning interatomic potentials	Mar 24, 2026	—Unverified
Efficient Hallucination Detection: Adaptive Bayesian Estimation of Semantic Entropy with Guided Semantic Exploration	Mar 24, 2026	—Unverified
Learning What Matters Now: Dynamic Preference Inference under Contextual Shifts	Mar 24, 2026	—Unverified
Focus, Don't Prune: Identifying Instruction-Relevant Regions for Information-Rich Image Understanding	Mar 24, 2026	—Unverified
MultiCam: On-the-fly Multi-Camera Pose Estimation Using Spatiotemporal Overlaps of Known Objects	Mar 24, 2026	—Unverified
URA-Net: Uncertainty-Integrated Anomaly Perception and Restoration Attention Network for Unsupervised Anomaly Detection	Mar 24, 2026	—Unverified
UAV-DETR: DETR for Anti-Drone Target Detection	Mar 24, 2026	—Unverified
L-UNet: An LSTM Network for Remote Sensing Image Change Detection	Mar 24, 2026	—Unverified
TorR: Towards Brain-Inspired Task-Oriented Reasoning via Cache-Oriented Algorithm-Architecture Co-design	Mar 24, 2026	—Unverified
The Coordinate System Problem in Persistent Structural Memory for Neural Architectures	Mar 24, 2026	—Unverified
A Feature Shuffling and Restoration Strategy for Universal Unsupervised Anomaly Detection	Mar 24, 2026	—Unverified
The Evolution of Tool Use in LLM Agents: From Single-Tool Call to Multi-Tool Orchestration	Mar 24, 2026	—Unverified
Grounding Sim-to-Real Generalization in Dexterous Manipulation: An Empirical Study with Vision-Language-Action Models	Mar 24, 2026	—Unverified
Continuous Optimization for Satisfiability Modulo Theories on Linear Real Arithmetic	Mar 24, 2026	—Unverified
Confidence Calibration under Ambiguous Ground Truth	Mar 24, 2026	—Unverified
TreeTeaming: Autonomous Red-Teaming of Vision-Language Models via Hierarchical Strategy Exploration	Mar 24, 2026	—Unverified
ForestPrune: High-ratio Visual Token Compression for Video Multimodal Large Language Models via Spatial-Temporal Forest Modeling	Mar 24, 2026	—Unverified
From the AI Act to a European AI Agency: Completing the Union's Regulatory Architecture	Mar 24, 2026	—Unverified
Multilingual KokoroChat: A Multi-LLM Ensemble Translation Method for Creating a Multilingual Counseling Dialogue Dataset	Mar 24, 2026	—Unverified
When AVSR Meets Video Conferencing: Dataset, Degradation, and the Hidden Mechanism Behind Performance Collapse	Mar 24, 2026	—Unverified
EVA: Efficient Reinforcement Learning for End-to-End Video Agent	Mar 24, 2026	—Unverified
The EU AI Act and the Rights-based Approach to Technological Governance	Mar 24, 2026	—Unverified
Quality Over Clicks: Intrinsic Quality-Driven Iterative Reinforcement Learning for Cold-Start E-Commerce Query Suggestion	Mar 24, 2026	—Unverified
ProGRank: Probe-Gradient Reranking to Defend Dense-Retriever RAG from Corpus Poisoning	Mar 24, 2026	—Unverified
Caption Generation for Dongba Paintings via Prompt Learning and Semantic Fusion	Mar 24, 2026	—Unverified
Weak-PDE-Net: Discovering Open-Form PDEs via Differentiable Symbolic Networks and Weak Formulation	Mar 24, 2026	—Unverified
Cluster-Wise Spatio-Temporal Masking for Efficient Video-Language Pretraining	Mar 24, 2026	—Unverified
Privacy-Preserving EHR Data Transformation via Geometric Operators: A Human-AI Co-Design Technical Report	Mar 24, 2026	—Unverified
Set-Valued Prediction for Large Language Models with Feasibility-Aware Coverage Guarantees	Mar 24, 2026	—Unverified
Beyond Theoretical Bounds: Empirical Privacy Loss Calibration for Text Rewriting Under Local Differential Privacy	Mar 24, 2026	—Unverified
FCL-COD: Weakly Supervised Camouflaged Object Detection with Frequency-aware and Contrastive Learning	Mar 24, 2026	—Unverified
Where Experts Disagree, Models Fail: Detecting Implicit Legal Citations in French Court Decisions	Mar 24, 2026	—Unverified
DariMis: Harm-Aware Modeling for Dari Misinformation Detection on YouTube	Mar 24, 2026	—Unverified
JFTA-Bench: Evaluate LLM's Ability of Tracking and Analyzing Malfunctions Using Fault Trees	Mar 24, 2026	—Unverified
Can Graph Foundation Models Generalize Over Architecture?	Mar 24, 2026	—Unverified
Beyond Hate: Differentiating Uncivil and Intolerant Speech in Multimodal Content Moderation	Mar 24, 2026	—Unverified
VQ-Jarvis: Retrieval-Augmented Video Restoration Agent with Sharp Vision and Fast Thought	Mar 24, 2026	—Unverified
PaperVoyager : Building Interactive Web with Visual Language Models	Mar 24, 2026	—Unverified
On the use of Aggregation Operators to improve Human Identification using Dental Records	Mar 24, 2026	—Unverified
Can Large Language Models Reason and Optimize Under Constraints?	Mar 24, 2026	—Unverified
AgentRAE: Remote Action Execution through Notification-based Visual Backdoors against Screenshots-based Mobile GUI Agents	Mar 24, 2026	—Unverified
Parametric Knowledge and Retrieval Behavior in RAG Fine-Tuning for Electronic Design Automation	Mar 24, 2026	—Unverified
MSR-HuBERT: Self-supervised Pre-training for Adaptation to Multiple Sampling Rates	Mar 24, 2026	—Unverified
DBAutoDoc: Automated Discovery and Documentation of Undocumented Database Schemas via Statistical Analysis and Iterative LLM Refinement	Mar 24, 2026	—Unverified
Post-Selection Distributional Model Evaluation	Mar 24, 2026	—Unverified
Prompt Amplification and Zero-Shot Late Fusion in Audio-Language Models for Speech Emotion Recognition	Mar 24, 2026	—Unverified