The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6901–6950 of 661570 papers

Title	Date	Status
Cost-Efficient Multimodal LLM Inference via Cross-Tier GPU Heterogeneity	Mar 13, 2026	—Unverified
AI Planning Framework for LLM-Based Web Agents	Mar 13, 2026	—Unverified
Text-Phase Synergy Network with Dual Priors for Unsupervised Cross-Domain Image Retrieval	Mar 13, 2026	—Unverified
TaoBench: Do Automated Theorem Prover LLMs Generalize Beyond MathLib?	Mar 13, 2026	—Unverified
Show, Don't Tell: Detecting Novel Objects by Watching Human Videos	Mar 13, 2026	—Unverified
FC-Track: Overlap-Aware Post-Association Correction for Online Multi-Object Tracking	Mar 13, 2026	—Unverified
Catalyst4D: High-Fidelity 3D-to-4D Scene Editing via Dynamic Propagation	Mar 13, 2026	—Unverified
Empowering Semantic-Sensitive Underwater Image Enhancement with VLM	Mar 13, 2026	—Unverified
The RIGID Framework: Research-Integrated, Generative AI-Mediated Instructional Design	Mar 13, 2026	—Unverified
Generalized Recognition of Basic Surgical Actions Enables Skill Assessment and Vision-Language-Model-based Surgical Planning	Mar 13, 2026	—Unverified
What Makes VLMs Robust? Towards Reconciling Robustness and Accuracy in Vision-Language Models	Mar 13, 2026	—Unverified
A Multi-task Large Reasoning Model for Molecular Science	Mar 13, 2026	—Unverified
OARS: Process-Aware Online Alignment for Generative Real-World Image Super-Resolution	Mar 13, 2026	—Unverified
Context is all you need: Towards autonomous model-based process design using agentic AI in flowsheet simulations	Mar 13, 2026	—Unverified
Rethinking Multiple-Choice Questions for RLVR: Unlocking Potential via Distractor Design	Mar 13, 2026	—Unverified
Hierarchical Dual-Change Collaborative Learning for UAV Scene Change Captioning	Mar 13, 2026	—Unverified
Multimodal Protein Language Models for Enzyme Kinetic Parameters: From Substrate Recognition to Conformational Adaptation	Mar 13, 2026	—Unverified
Team LEYA in 10th ABAW Competition: Multimodal Ambivalence/Hesitancy Recognition Approach	Mar 13, 2026	—Unverified
Wear Classification of Abrasive Flap Wheels using a Hierarchical Deep Learning Approach	Mar 13, 2026	—Unverified
Composing Driving Worlds through Disentangled Control for Adversarial Scenario Generation	Mar 13, 2026	—Unverified
Surrogates for Physics-based and Data-driven Modelling of Parametric Systems: Review and New Perspectives	Mar 13, 2026	—Unverified
TRACE: Structure-Aware Character Encoding for Robust and Generalizable Document Watermarking	Mar 13, 2026	—Unverified
Test-time RL alignment exposes task familiarity artifacts in LLM benchmarks	Mar 13, 2026	—Unverified
Explainable AI Using Inherently Interpretable Components for Wearable-based Health Monitoring	Mar 13, 2026	—Unverified
Enhanced Drug-drug Interaction Prediction Using Adaptive Knowledge Integration	Mar 13, 2026	—Unverified
Forecasting Epileptic Seizures from Contactless Camera via Cross-Species Transfer Learning	Mar 13, 2026	—Unverified
A theory of learning data statistics in diffusion models, from easy to hard	Mar 13, 2026	—Unverified
Learning from Child-Directed Speech in Two-Language Scenarios: A French-English Case Study	Mar 13, 2026	—Unverified
ODRL Policy Comparison Through Normalisation	Mar 13, 2026	—Unverified
VIRD: View-Invariant Representation through Dual-Axis Transformation for Cross-View Pose Estimation	Mar 13, 2026	—Unverified
Retrieval-Enhanced Real Estate Appraisal	Mar 13, 2026	—Unverified
Delta1 with LLM: symbolic and neural integration for credible and explainable reasoning	Mar 13, 2026	—Unverified
Efficient Real-World Autonomous Racing via Attenuated Residual Policy Optimization	Mar 13, 2026	CodeCode Available
SCOPE: Semantic Coreset with Orthogonal Projection Embeddings for Federated learning	Mar 13, 2026	—Unverified
Test-Time Attention Purification for Backdoored Large Vision Language Models	Mar 13, 2026	—Unverified
Deconstructing the Failure of Ideal Noise Correction: A Three-Pillar Diagnosis	Mar 13, 2026	—Unverified
Accelerating Stroke MRI with Diffusion Probabilistic Models through Large-Scale Pre-training and Target-Specific Fine-Tuning	Mar 13, 2026	—Unverified
FraudFox: Adaptable Fraud Detection in the Real World	Mar 13, 2026	—Unverified
Structured Distillation for Personalized Agent Memory: 11x Token Reduction with Retrieval Preservation	Mar 13, 2026	—Unverified
From AI Weather Prediction to Infrastructure Resilience: A Correction-Downscaling Framework for Tropical Cyclone Impacts	Mar 13, 2026	—Unverified
VIGS-SLAM: Visual Inertial Gaussian Splatting SLAM	Mar 13, 2026	—Unverified
Colluding LoRA: A Composite Attack on LLM Safety Alignment	Mar 13, 2026	—Unverified
SRAM-Based Compute-in-Memory Accelerator for Linear-decay Spiking Neural Networks	Mar 13, 2026	—Unverified
OffTopicEval: When Large Language Models Enter the Wrong Chat, Almost Always!	Mar 13, 2026	—Unverified
A Tutorial on Cognitive Biases in Agentic AI-Driven 6G Autonomous Networks	Mar 13, 2026	—Unverified
Reinforcing the Weakest Links: Modernizing SIENA with Targeted Deep Learning Integration	Mar 13, 2026	CodeCode Available
On Linear Separability of the MNIST Handwritten Digits Dataset	Mar 13, 2026	—Unverified
Scaling Laws and Pathologies of Single-Layer PINNs: Network Width and PDE Nonlinearity	Mar 13, 2026	—Unverified
As Language Models Scale, Low-order Linear Depth Dynamics Emerge	Mar 13, 2026	—Unverified
A Reduction Algorithm for Markovian Contextual Linear Bandits	Mar 13, 2026	—Unverified