The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7851–7900 of 661570 papers

Title	Date	Status	Hype
SeDa: A Unified System for Dataset Discovery and Multi-Entity Augmented Semantic Exploration	Mar 11, 2026	—Unverified	0
Alignment as Iatrogenesis: Pastoral Power, Collective Pathology, and the Structural Limits of Monolingual Safety Evaluation	Mar 11, 2026	—Unverified	0
A New Modeling to Feature Selection Based on the Fuzzy Rough Set Theory in Normal and Optimistic States on Hybrid Information Systems	Mar 11, 2026	—Unverified	0
PathoScribe: Transforming Pathology Data into a Living Library with a Unified LLM-Driven Framework for Semantic Retrieval and Clinical Integration	Mar 11, 2026	—Unverified	0
PlayWorld: Learning Robot World Models from Autonomous Play	Mar 11, 2026	—Unverified	0
VIVID-Med: LLM-Supervised Structured Pretraining for Deployable Medical ViTs	Mar 11, 2026	—Unverified	0
Transformer-Based Multi-Region Segmentation and Radiomic Analysis of HR-pQCT Imaging for Osteoporosis Classification	Mar 11, 2026	—Unverified	0
Agentic AI as a Network Control-Plane Intelligence Layer for Federated Learning over 6G	Mar 11, 2026	—Unverified	0
Curveball Steering: The Right Direction To Steer Isn't Always Linear	Mar 11, 2026	—Unverified	0
SPAARS: Safer RL Policy Alignment through Abstract Exploration and Refined Exploitation of Action Space	Mar 11, 2026	—Unverified	0
Streaming Autoregressive Video Generation via Diagonal Distillation	Mar 11, 2026	—Unverified	2
A Saccade-inspired Approach to Image Classification using Vision Transformer Attention Maps	Mar 11, 2026	—Unverified	0
MM-tau-p^2: Persona-Adaptive Prompting for Robust Multi-Modal Agent Evaluation in Dual-Control Settings	Mar 11, 2026	—Unverified	0
Fusing Semantic, Lexical, and Domain Perspectives for Recipe Similarity Estimation	Mar 11, 2026	—Unverified	0
AutoViVQA: A Large-Scale Automatically Constructed Dataset for Vietnamese Visual Question Answering	Mar 11, 2026	—Unverified	0
ENIGMA-360: An Ego-Exo Dataset for Human Behavior Understanding in Industrial Scenarios	Mar 11, 2026	—Unverified	0
Ego: Embedding-Guided Personalization of Vision-Language Models	Mar 11, 2026	—Unverified	0
LCA: Local Classifier Alignment for Continual Learning	Mar 11, 2026	—Unverified	0
MA-EgoQA: Question Answering over Egocentric Videos from Multiple Embodied Agents	Mar 11, 2026	—Unverified	1
Conversational AI-Enhanced Exploration System to Query Large-Scale Digitised Collections of Natural History Museums	Mar 11, 2026	—Unverified	0
Simulation-in-the-Reasoning (SiR): A Conceptual Framework for Empirically Grounded AI in Autonomous Transportation	Mar 11, 2026	—Unverified	0
Data-Driven Integration Kernels for Interpretable Nonlocal Operator Learning	Mar 11, 2026	—Unverified	0
Large language models can disambiguate opioid slang on social media	Mar 11, 2026	—Unverified	0
PC-Diffuser: Path-Consistent Capsule CBF Safety Filtering for Diffusion-Based Trajectory Planner	Mar 11, 2026	—Unverified	0
Fuel Gauge: Estimating Chain-of-Thought Length Ahead of Time in Large Multimodal Models	Mar 11, 2026	—Unverified	0
Overcoming Visual Clutter in Vision Language Action Models via Concept-Gated Visual Distillation	Mar 11, 2026	—Unverified	0
On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits	Mar 11, 2026	—Unverified	0
Mitigating Translationese Bias in Multilingual LLM-as-a-Judge via Disentangled Information Bottleneck	Mar 11, 2026	—Unverified	0
Utility Function is All You Need: LLM-based Congestion Control	Mar 11, 2026	—Unverified	0
Designing Service Systems from Textual Evidence	Mar 11, 2026	—Unverified	0
HEAL: Hindsight Entropy-Assisted Learning for Reasoning Distillation	Mar 11, 2026	—Unverified	0
One Token, Two Fates: A Unified Framework via Vision Token Manipulation Against MLLMs Hallucination	Mar 11, 2026	—Unverified	0
Dynamic Knowledge Fusion for Multi-Domain Dialogue State Tracking	Mar 11, 2026	—Unverified	0
Beyond Interleaving: Causal Attention Reformulations for Generative Recommender Systems	Mar 11, 2026	—Unverified	0
GeoSense: Internalizing Geometric Necessity Perception for Multimodal Reasoning	Mar 11, 2026	—Unverified	0
Speech Codec Probing from Semantic and Phonetic Perspectives	Mar 11, 2026	—Unverified	0
Few-Shot Adaptation to Non-Stationary Environments via Latent Trend Embedding for Robotics	Mar 11, 2026	—Unverified	0
Graph-GRPO: Training Graph Flow Models with Reinforcement Learning	Mar 11, 2026	—Unverified	0
Reactive Writers: How Co-Writing with AI Changes How We Engage with Ideas	Mar 11, 2026	—Unverified	0
Causal Concept Graphs in LLM Latent Space for Stepwise Reasoning	Mar 11, 2026	—Unverified	0
Optimal Expert-Attention Allocation in Mixture-of-Experts: A Scalable Law for Dynamic Model Design	Mar 11, 2026	—Unverified	0
Motion Forcing: A Decoupled Framework for Robust Video Generation in Motion Dynamics	Mar 11, 2026	—Unverified	0
Effective Dataset Distillation for Spatio-Temporal Forecasting with Bi-dimensional Compression	Mar 11, 2026	—Unverified	0
Enhancing Network Intrusion Detection Systems: A Multi-Layer Ensemble Approach to Mitigate Adversarial Attacks	Mar 11, 2026	—Unverified	0
Fighting Hallucinations with Counterfactuals: Diffusion-Guided Perturbations for LVLM Hallucination Suppression	Mar 11, 2026	—Unverified	0
Domain-Adaptive Health Indicator Learning with Degradation-Stage Synchronized Sampling and Cross-Domain Autoencoder	Mar 11, 2026	—Unverified	0
AsyncMDE: Real-Time Monocular Depth Estimation via Asynchronous Spatial Memory	Mar 11, 2026	—Unverified	0
The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training	Mar 11, 2026	—Unverified	0
FAR-Dex: Few-shot Data Augmentation and Adaptive Residual Policy Refinement for Dexterous Manipulation	Mar 11, 2026	—Unverified	0
Spatio-Temporal Forecasting of Retaining Wall Deformation: Mitigating Error Accumulation via Multi-Resolution ConvLSTM Stacking Ensemble	Mar 11, 2026	—Unverified	0