The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10951–11000 of 661570 papers

Title	Date	Status
Measuring the Fragility of Trust: Devising Credibility Index via Explanation Stability (CIES) for Business Decision Support Systems	Mar 5, 2026	—Unverified
Layer by layer, module by module: Choose both for optimal OOD probing of ViT	Mar 5, 2026	—Unverified
PersianPunc: A Large-Scale Dataset and BERT-Based Approach for Persian Punctuation Restoration	Mar 5, 2026	—Unverified
Loop Closure via Maximal Cliques in 3D LiDAR-Based SLAM	Mar 5, 2026	—Unverified
Video-based Locomotion Analysis for Fish Health Monitoring	Mar 5, 2026	—Unverified
Model Change for Description Logic Concepts	Mar 5, 2026	—Unverified
Thermodynamic Response Functions in Singular Bayesian Models	Mar 5, 2026	—Unverified
FuseDiff: Symmetry-Preserving Joint Diffusion for Dual-Target Structure-Based Drug Design	Mar 5, 2026	—Unverified
Keeping the Evidence Chain: Semantic Evidence Allocation for Training-Free Token Pruning in Video Temporal Grounding	Mar 5, 2026	—Unverified
Uni-LVC: A Unified Method for Intra- and Inter-Mode Learned Video Compression	Mar 5, 2026	—Unverified
POET-X: Memory-efficient LLM Training by Scaling Orthogonal Transformation	Mar 5, 2026	—Unverified
Let's Talk, Not Type: An Oral-First Multi-Agent Architecture for Guaraní	Mar 5, 2026	—Unverified
Distant Object Localisation from Noisy Image Segmentation Sequences	Mar 5, 2026	—Unverified
OSPO: Object-Centric Self-Improving Preference Optimization for Text-to-Image Generation	Mar 5, 2026	—Unverified
Quantitative convergence of trained single layer neural networks to Gaussian processes	Mar 5, 2026	—Unverified
Reinforcement Learning for Power-Flow Network Analysis	Mar 5, 2026	—Unverified
From Phase Grounding to Intelligent Surgical Narratives	Mar 5, 2026	—Unverified
Feature Resemblance: On the Theoretical Understanding of Analogical Reasoning in Transformers	Mar 5, 2026	—Unverified
Distributed Partial Information Puzzles: Examining Common Ground Construction Under Epistemic Asymmetry	Mar 5, 2026	—Unverified
A Behaviour-Aware Federated Forecasting Framework for Distributed Stand-Alone Wind Turbines	Mar 5, 2026	—Unverified
Random Dot Product Graphs as Dynamical Systems: Limitations and Opportunities	Mar 5, 2026	—Unverified
MI-DETR: A Strong Baseline for Moving Infrared Small Target Detection with Bio-Inspired Motion Integration	Mar 5, 2026	CodeCode Available
The Consensus Trap: Dissecting Subjectivity and the "Ground Truth" Illusion in Data Annotation	Mar 5, 2026	—Unverified
AILS-NTUA at SemEval-2026 Task 3: Efficient Dimensional Aspect-Based Sentiment Analysis	Mar 5, 2026	—Unverified
Pessimistic Auxiliary Policy for Offline Reinforcement Learning	Mar 5, 2026	—Unverified
Curriculum Learning for Efficient Chain-of-Thought Distillation via Structure-Aware Masking and GRPO	Mar 5, 2026	—Unverified
EVMbench: Evaluating AI Agents on Smart Contract Security	Mar 5, 2026	—Unverified
Legal interpretation and AI: from expert systems to argumentation and LLMs	Mar 5, 2026	—Unverified
Asymptotic Behavior of Multi--Task Learning: Implicit Regularization and Double Descent Effects	Mar 5, 2026	—Unverified
Interpretable Motion Artificat Detection in structural Brain MRI	Mar 5, 2026	—Unverified
Lifelong Language-Conditioned Robotic Manipulation Learning	Mar 5, 2026	—Unverified
LHM-Humanoid: Learning a Unified Policy for Long-Horizon Humanoid Whole-Body Loco-Manipulation in Diverse Messy Environments	Mar 5, 2026	—Unverified
The unreasonable effectiveness of pattern matching	Mar 5, 2026	—Unverified
Machine Learning for analysis of Multiple Sclerosis cross-tissue bulk and single-cell transcriptomics data	Mar 5, 2026	—Unverified
The Cascade Equivalence Hypothesis: When Do Speech LLMs Behave Like ASRLLM Pipelines?	Mar 5, 2026	—Unverified
Evaluating and Correcting Human Annotation Bias in Dynamic Micro-Expression Recognition	Mar 5, 2026	CodeCode Available
Optimizing Multi-Modality Trackers via Significance-Regularized Tuning	Mar 5, 2026	CodeCode Available
EgoTraj-Bench: Towards Robust Trajectory Prediction Under Ego-view Noisy Observations	Mar 5, 2026	CodeCode Available
Detecting Hallucinations in Authentic LLM-Human Interactions	Mar 5, 2026	CodeCode Available
TerraCodec: Compressing Optical Earth Observation Data	Mar 5, 2026	CodeCode Available
RePo: Language Models with Context Re-Positioning	Mar 5, 2026	CodeCode Available
Yuan3.0 Ultra: A Trillion-Parameter Enterprise-Oriented MoE LLM	Mar 5, 2026	CodeCode Available
Agentic Very Long Video Understanding	Mar 5, 2026	CodeCode Available
PerfGuard: A Performance-Aware Agent for Visual Content Generation	Mar 5, 2026	CodeCode Available
Dr. Seg: Revisiting GRPO Training for Visual Large Language Models through Perception-Oriented Design	Mar 5, 2026	CodeCode Available
TumorFlow: Physics-Guided Longitudinal MRI Synthesis of Glioblastoma Growth	Mar 5, 2026	CodeCode Available
Toward Real-world Infrared Image Super-Resolution: A Unified Autoregressive Framework and Benchmark Dataset	Mar 5, 2026	CodeCode Available
Guiding Diffusion-based Reconstruction with Contrastive Signals for Balanced Visual Representation	Mar 5, 2026	CodeCode Available
Locality-Attending Vision Transformer	Mar 5, 2026	CodeCode Available
MPCEval: A Benchmark for Multi-Party Conversation Generation	Mar 5, 2026	CodeCode Available