The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1151–1200 of 659983 papers

Title	Date	Status
Safety as Computation: Certified Answer Reuse via Capability Closure in Task-Oriented Dialogue	Mar 22, 2026	—Unverified
SynPO: Synergizing Descriptiveness and Preference Optimization for Video Detailed Captioning	Mar 22, 2026	—Unverified
Joint Surrogate Learning of Objectives, Constraints, and Sensitivities for Efficient Multi-objective Optimization of Neural Dynamical Systems	Mar 22, 2026	—Unverified
Consistent but Dangerous: Per-Sample Safety Classification Reveals False Reliability in Medical Vision-Language Models	Mar 22, 2026	—Unverified
AutoMOOSE: An Agentic AI for Autonomous Phase-Field Simulation	Mar 22, 2026	—Unverified
OrbitStream: Training-Free Adaptive 360-degree Video Streaming via Semantic Potential Fields	Mar 22, 2026	—Unverified
SkinCLIP-VL: Consistency-Aware Vision-Language Learning for Multimodal Skin Cancer Diagnosis	Mar 22, 2026	—Unverified
KLDrive: Fine-Grained 3D Scene Reasoning for Autonomous Driving based on Knowledge Graph	Mar 22, 2026	—Unverified
Deep Attention-based Sequential Ensemble Learning for BLE-Based Indoor Localization in Care Facilities	Mar 22, 2026	—Unverified
TabPFN Extensions for Interpretable Geotechnical Modelling	Mar 22, 2026	—Unverified
Fuel Consumption Prediction: A Comparative Analysis of Machine Learning Paradigms	Mar 22, 2026	—Unverified
Reading Between the Lines: How Electronic Nonverbal Cues shape Emotion Decoding	Mar 22, 2026	—Unverified
Benchmarking Scientific Machine Learning Models for Air Quality Data	Mar 22, 2026	—Unverified
Statistical Learning for Latent Embedding Alignment with Application to Brain Encoding and Decoding	Mar 22, 2026	—Unverified
Confidence Freeze: Early Success Induces a Metastable Decoupling of Metacognition and Behaviour	Mar 22, 2026	—Unverified
A Two-stage Transformer Framework for Temporal Localization of Distracted Driver Behaviors	Mar 22, 2026	—Unverified
Harmful Visual Content Manipulation Matters in Misinformation Detection Under Multimedia Scenarios	Mar 22, 2026	—Unverified
SGAD-SLAM: Splatting Gaussians at Adjusted Depth for Better Radiance Fields in RGBD SLAM	Mar 22, 2026	—Unverified
Semi-Supervised Learning with Balanced Deep Representation Distributions	Mar 22, 2026	—Unverified
DGRNet: Disagreement-Guided Refinement for Uncertainty-Aware Brain Tumor Segmentation	Mar 22, 2026	—Unverified
Stochastic approximation in non-markovian environments revisited	Mar 22, 2026	—Unverified
Representation-Level Adversarial Regularization for Clinically Aligned Multitask Thyroid Ultrasound Assessment	Mar 22, 2026	—Unverified
Mixture of Chapters: Scaling Learnt Memory in Transformers	Mar 22, 2026	—Unverified
Learning to Optimize Joint Source and RIS-assisted Channel Encoding for Multi-User Semantic Communication Systems	Mar 22, 2026	—Unverified
Learning Progressive Adaptation for Multi-Modal Tracking	Mar 22, 2026	—Unverified
CounterScene: Counterfactual Causal Reasoning in Generative World Models for Safety-Critical Closed-Loop Evaluation	Mar 22, 2026	—Unverified
ResPrune: Text-Conditioned Subspace Reconstruction for Visual Token Pruning in Large Vision-Language Models	Mar 22, 2026	—Unverified
DMMRL: Disentangled Multi-Modal Representation Learning via Variational Autoencoders for Molecular Property Prediction	Mar 22, 2026	—Unverified
Frequency Switching Mechanism for Parameter-E!cient Multi-Task Learning	Mar 22, 2026	—Unverified
LiFR-Seg: Anytime High-Frame-Rate Segmentation via Event-Guided Propagation	Mar 22, 2026	—Unverified
ReDiffuse: Rotation Equivariant Diffusion Model for Multi-focus Image Fusion	Mar 22, 2026	—Unverified
Anatomical Prior-Driven Framework for Autonomous Robotic Cardiac Ultrasound Standard View Acquisition	Mar 22, 2026	—Unverified
One Pool Is Not Enough: Multi-Cluster Memory for Practical Test-Time Adaptation	Mar 22, 2026	—Unverified
Can LLMs Fool Graph Learning? Exploring Universal Adversarial Attacks on Text-Attributed Graphs	Mar 22, 2026	—Unverified
Beyond a Single Signal: SPECTREG2, A Unified MultiExpert Anomaly Detector for Unknown Unknowns	Mar 22, 2026	—Unverified
Revisiting Tree Search for LLMs: Gumbel and Sequential Halving for Budget-Scalable Reasoning	Mar 22, 2026	—Unverified
Many Dialects, Many Languages, One Cultural Lens: Evaluating Multilingual VLMs for Bengali Culture Understanding Across Historically Linked Languages and Regional Dialects	Mar 22, 2026	—Unverified
GIDE: Unlocking Diffusion LLMs for Precise Training-Free Image Editing	Mar 22, 2026	—Unverified
Prompt replay: speeding up grpo with on-policy reuse of high-signal prompts	Mar 22, 2026	—Unverified
LLM-based Automated Architecture View Generation: Where Are We Now?	Mar 22, 2026	—Unverified
ALMAB-DC: Active Learning, Multi-Armed Bandits, and Distributed Computing for Sequential Experimental Design and Black-Box Optimization	Mar 22, 2026	—Unverified
Architecture for Multi-Unmanned Aerial Vehicles based Autonomous Precision Agriculture Systems	Mar 22, 2026	—Unverified
Context Selection for Hypothesis and Statistical Evidence Extraction from Full-Text Scientific Articles	Mar 22, 2026	—Unverified
Is Monitoring Enough? Strategic Agent Selection For Stealthy Attack in Multi-Agent Discussions	Mar 22, 2026	—Unverified
Boundary-Aware Instance Segmentation in Microscopy Imaging	Mar 22, 2026	—Unverified
Pretrained Video Models as Differentiable Physics Simulators for Urban Wind Flows	Mar 22, 2026	—Unverified
A Large-Scale Remote Sensing Dataset and VLM-based Algorithm for Fine-Grained Road Hierarchy Classification	Mar 22, 2026	—Unverified
Does AI Homogenize Student Thinking? A Multi-Dimensional Analysis of Structural Convergence in AI-Augmented Essays	Mar 22, 2026	—Unverified
Plant Taxonomy Meets Plant Counting: A Fine-Grained, Taxonomic Dataset for Counting Hundreds of Plant Species	Mar 22, 2026	—Unverified
When Convenience Becomes Risk: A Semantic View of Under-Specification in Host-Acting Agents	Mar 22, 2026	—Unverified