The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9351–9400 of 661570 papers

Title	Date	Status
Safety Under Scaffolding: How Evaluation Conditions Shape Measured Safety	Mar 8, 2026	—Unverified
Toward Epistemic Stability: Engineering Consistent Procedures for Industrial LLM Hallucination Reduction	Mar 8, 2026	—Unverified
Gated Adaptation for Continual Learning in Human Activity Recognition	Mar 8, 2026	—Unverified
Stable Multi-Drone GNSS Tracking System for Marine Robots	Mar 8, 2026	—Unverified
4DRC-OCC: Robust Semantic Occupancy Prediction Through Fusion of 4D Radar and Camera	Mar 8, 2026	—Unverified
CLAD-Net: Continual Activity Recognition in Multi-Sensor Wearable Systems	Mar 8, 2026	—Unverified
Dual Randomized Smoothing: Beyond Global Noise Variance	Mar 8, 2026	—Unverified
Robustness Verification of Graph Neural Networks Via Lightweight Satisfiability Testing	Mar 8, 2026	—Unverified
Crowdsourcing the Frontier: Advancing Hybrid Physics-ML Climate Simulation via a $50,000 Kaggle Competition	Mar 8, 2026	—Unverified
UltraUPConvNet: A UPerNet- and ConvNeXt-Based Multi-Task Network for Ultrasound Tissue Segmentation and Disease Prediction	Mar 8, 2026	CodeCode Available
ABD: Default Exception Abduction in Finite First Order Worlds	Mar 8, 2026	—Unverified
A Lightweight MPC Bidding Framework for Brand Auction Ads	Mar 8, 2026	—Unverified
Using GPUs And LLMs Can Be Satisfying for Nonlinear Real Arithmetic Problems	Mar 8, 2026	—Unverified
QuadAI at SemEval-2026 Task 3: Ensemble Learning of Hybrid RoBERTa and LLMs for Dimensional Aspect-Based Sentiment Analysis	Mar 8, 2026	CodeCode Available
Go Beyond Your Means: Unlearning with Per-Sample Gradient Orthogonalization	Mar 8, 2026	—Unverified
CompanionCast: Toward Social Collaboration with Multi-Agent Systems in Shared Experiences	Mar 8, 2026	—Unverified
TokMem: One-Token Procedural Memory for Large Language Models	Mar 8, 2026	—Unverified
Streaming Drag-Oriented Interactive Video Manipulation: Drag Anything, Anytime!	Mar 8, 2026	—Unverified
Ego-Vision World Model for Humanoid Contact Planning	Mar 8, 2026	—Unverified
Towards Efficient Federated Learning of Networked Mixture-of-Experts for Mobile Edge Computing	Mar 8, 2026	—Unverified
Meta-RL Induces Exploration in Language Agents	Mar 8, 2026	—Unverified
ReMeDI: Refined Memory for Disambiguation of Identities with SAM3 in Surgical Segmentation	Mar 8, 2026	—Unverified
Certifying the Right to Be Forgotten: Primal-Dual Optimization for Sample and Label Unlearning in Vertical Federated Learning	Mar 8, 2026	—Unverified
BioAgent Bench: An AI Agent Evaluation Suite for Bioinformatics	Mar 8, 2026	—Unverified
In-Run Data Shapley for Adam Optimizer	Mar 8, 2026	—Unverified
Learning Page Order in Shuffled WOO Releases	Mar 8, 2026	—Unverified
OVerSeeC: Open-Vocabulary Costmap Generation from Satellite Images and Natural Language	Mar 8, 2026	—Unverified
Whole-Brain Connectomic Graph Model Enables Whole-Body Locomotion Control in Fruit Fly	Mar 8, 2026	—Unverified
On Sample-Efficient Generalized Planning via Learned Transition Models	Mar 8, 2026	—Unverified
How Well Do Multimodal Models Reason on ECG Signals?	Mar 8, 2026	—Unverified
Test-Time Meta-Adaptation with Self-Synthesis	Mar 8, 2026	—Unverified
Memory for Autonomous LLM Agents:Mechanisms, Evaluation, and Emerging Frontiers	Mar 8, 2026	—Unverified
A Primer on Evolutionary Frameworks for Near-Field Multi-Source Localization	Mar 8, 2026	—Unverified
Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques	Mar 8, 2026	—Unverified
FrameVGGT: Frame Evidence Rolling Memory for streaming VGGT	Mar 8, 2026	—Unverified
RoboPCA: Pose-centered Affordance Learning from Human Demonstrations for Robot Manipulation	Mar 8, 2026	—Unverified
PARSE: Part-Aware Relational Spatial Modeling	Mar 8, 2026	—Unverified
VoiceSHIELD-Small: Real-Time Malicious Speech Detection and Transcription	Mar 8, 2026	—Unverified
YAQIN: Culturally Sensitive, Agentic AI for Mental Healthcare Support Among Muslim Women in the UK	Mar 8, 2026	—Unverified
A Novel Multi-Agent Architecture to Reduce Hallucinations of Large Language Models in Multi-Step Structural Modeling	Mar 8, 2026	—Unverified
Large Language Model for Discrete Optimization Problems: Evaluation and Step-by-step Reasoning	Mar 8, 2026	—Unverified
3ViewSense: Spatial and Mental Perspective Reasoning from Orthographic Views in Vision-Language Models	Mar 8, 2026	—Unverified
Uncertainty-Gated Generative Modeling	Mar 8, 2026	—Unverified
Whitening Reveals Cluster Commitment as the Geometric Separator of Hallucination Types	Mar 8, 2026	—Unverified
AR2-4FV: Anchored Referring and Re-identification for Long-Term Grounding in Fixed-View Videos	Mar 8, 2026	—Unverified
DECADE: A Temporally-Consistent Unsupervised Diffusion Model for Enhanced Rb-82 Dynamic Cardiac PET Image Denoising	Mar 8, 2026	—Unverified
MedQ-Deg: A Multidimensional Benchmark for Evaluating MLLMs Across Medical Image Quality Degradations	Mar 8, 2026	—Unverified
Geometric Knowledge-Assisted Federated Dual Knowledge Distillation Approach Towards Remote Sensing Satellite Imagery	Mar 8, 2026	—Unverified
Parameterized Brushstroke Style Transfer	Mar 8, 2026	—Unverified
Breaking Training Bottlenecks: Effective and Stable Reinforcement Learning for Coding Models	Mar 8, 2026	—Unverified