The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10651–10700 of 661570 papers

Title	Date	Status	Hype
Memory as Ontology: A Constitutional Memory Architecture for Persistent Digital Citizens	Mar 5, 2026	—Unverified	0
CONE: Embeddings for Complex Numerical Data Preserving Unit and Variable Semantics	Mar 5, 2026	—Unverified	0
DARE: Aligning LLM Agents with the R Statistical Ecosystem via Distribution-Aware Retrieval	Mar 5, 2026	—Unverified	1
Visioning Human-Agentic AI Teaming: Continuity, Tension, and Future Research	Mar 5, 2026	—Unverified	0
HiMAP-Travel: Hierarchical Multi-Agent Planning for Long-Horizon Constrained Travel	Mar 5, 2026	—Unverified	0
KindSleep: Knowledge-Informed Diagnosis of Obstructive Sleep Apnea from Oximetry	Mar 5, 2026	—Unverified	0
Stacked from One: Multi-Scale Self-Injection for Context Window Extension	Mar 5, 2026	—Unverified	0
Evaluating GPT-5 as a Multimodal Clinical Reasoner: A Landscape Commentary	Mar 5, 2026	—Unverified	0
ConTSG-Bench: A Unified Benchmark for Conditional Time Series Generation	Mar 5, 2026	—Unverified	0
TSEmbed: Unlocking Task Scaling in Universal Multimodal Embeddings	Mar 5, 2026	—Unverified	0
Distributional Reinforcement Learning with Information Bottleneck for Uncertainty-Aware DRAM Equalization	Mar 5, 2026	—Unverified	0
SinhaLegal: A Benchmark Corpus for Information Extraction and Analysis in Sinhala Legislative Texts	Mar 5, 2026	—Unverified	0
DSA-SRGS: Super-Resolution Gaussian Splatting for Dynamic Sparse-View DSA Reconstruction	Mar 5, 2026	—Unverified	0
Differentially Private Multimodal In-Context Learning	Mar 5, 2026	—Unverified	0
RMK RetinaNet: Rotated Multi-Kernel RetinaNet for Robust Oriented Object Detection in Remote Sensing Imagery	Mar 5, 2026	—Unverified	0
LAW & ORDER: Adaptive Spatial Weighting for Medical Diffusion and Segmentation	Mar 5, 2026	—Unverified	0
Privacy-Aware Camera 2.0 Technical Report	Mar 5, 2026	—Unverified	0
Distributional Equivalence in Linear Non-Gaussian Latent-Variable Cyclic Causal Models: Characterization and Learning	Mar 5, 2026	—Unverified	0
Breaking Contextual Inertia: Reinforcement Learning with Single-Turn Anchors for Stable Multi-Turn Interaction	Mar 5, 2026	—Unverified	0
Diffusion Policy through Conditional Proximal Policy Optimization	Mar 5, 2026	—Unverified	0
Comparative Evaluation of Traditional Methods and Deep Learning for Brain Glioma Imaging. Review Paper	Mar 5, 2026	—Unverified	0
Beyond Linear LLM Invocation: An Efficient and Effective Semantic Filter Paradigm	Mar 5, 2026	—Unverified	0
The Inductive Bias of Convolutional Neural Networks: Locality and Weight Sharing Reshape Implicit Regularization	Mar 5, 2026	—Unverified	0
WhisperAlign: Word-Boundary-Aware ASR and WhisperX-Anchored Pyannote Diarization for Long-Form Bengali Speech	Mar 5, 2026	—Unverified	0
Beyond the Context Window: A Cost-Performance Analysis of Fact-Based Memory vs. Long-Context LLMs for Persistent Agents	Mar 5, 2026	—Unverified	0
EchoGuard: An Agentic Framework with Knowledge-Graph Memory for Detecting Manipulative Communication in Longitudinal Dialogue	Mar 5, 2026	—Unverified	0
FC-VFI: Faithful and Consistent Video Frame Interpolation for High-FPS Slow Motion Video Generation	Mar 5, 2026	—Unverified	0
On the Strengths and Weaknesses of Data for Open-set Embodied Assistance	Mar 5, 2026	—Unverified	0
Autoscoring Anticlimax: A Meta-analytic Understanding of AI's Short-answer Shortcomings and Wording Weaknesses	Mar 5, 2026	—Unverified	0
VISA: Value Injection via Shielded Adaptation for Personalized LLM Alignment	Mar 5, 2026	—Unverified	0
From Unfamiliar to Familiar: Detecting Pre-training Data via Gradient Deviations in Large Language Models	Mar 5, 2026	—Unverified	0
SCoUT: Scalable Communication via Utility-Guided Temporal Grouping in Multi-Agent Reinforcement Learning	Mar 5, 2026	—Unverified	0
An Approach to Simultaneous Acquisition of Real-Time MRI Video, EEG, and Surface EMG for Articulatory, Brain, and Muscle Activity During Speech Production	Mar 5, 2026	—Unverified	0
GloSplat: Joint Pose-Appearance Optimization for Faster and More Accurate 3D Reconstruction	Mar 5, 2026	—Unverified	0
When Weak LLMs Speak with Confidence, Preference Alignment Gets Stronger	Mar 5, 2026	—Unverified	0
On Multi-Step Theorem Prediction via Non-Parametric Structural Priors	Mar 5, 2026	—Unverified	0
Structure Observation Driven Image-Text Contrastive Learning for Computed Tomography Report Generation	Mar 5, 2026	—Unverified	0
Scalable Injury-Risk Screening in Baseball Pitching From Broadcast Video	Mar 5, 2026	—Unverified	0
Diffusion-Based sRGB Real Noise Generation via Prompt-Driven Noise Representation Learning	Mar 5, 2026	—Unverified	0
DeformTrace: A Deformable State Space Model with Relay Tokens for Temporal Forgery Localization	Mar 5, 2026	—Unverified	0
Bounded State in an Infinite Horizon: Proactive Hierarchical Memory for Ad-Hoc Recall over Streaming Dialogues	Mar 5, 2026	—Unverified	0
Federated Modality-specific Encoders and Partially Personalized Fusion Decoder for Multimodal Brain Tumor Segmentation	Mar 5, 2026	—Unverified	0
FedAFD: Multimodal Federated Learning via Adversarial Fusion and Distillation	Mar 5, 2026	—Unverified	0
Knowledge-informed Bidding with Dual-process Control for Online Advertising	Mar 5, 2026	—Unverified	0
How Does the ReLU Activation Affect the Implicit Bias of Gradient Descent on High-dimensional Neural Network Regression?	Mar 5, 2026	—Unverified	0
Authorize-on-Demand: Dynamic Authorization with Legality-Aware Intellectual Property Protection for VLMs	Mar 5, 2026	—Unverified	0
U-Parking: Distributed UWB-Assisted Autonomous Parking System with Robust Localization and Intelligent Planning	Mar 5, 2026	—Unverified	0
EvoTool: Self-Evolving Tool-Use Policy Optimization in LLM Agents via Blame-Aware Mutation and Diversity-Aware Selection	Mar 5, 2026	—Unverified	0
AgentSCOPE: Evaluating Contextual Privacy Across Agentic Workflows	Mar 5, 2026	—Unverified	0
Deterministic Preprocessing and Interpretable Fuzzy Banding for Cost-per-Student Reporting from Extracted Records	Mar 5, 2026	—Unverified	0