The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5451–5500 of 661570 papers

Title	Date	Status	Hype
PMAx: An Agentic Framework for AI-Driven Process Mining	Mar 16, 2026	—Unverified	0
Conditional Rectified Flow-based End-to-End Rapid Seismic Inversion Method	Mar 16, 2026	—Unverified	0
Controlled Langevin Dynamics for Sampling of Feedforward Neural Networks Trained with Minibatches	Mar 16, 2026	—Unverified	0
Trajectory-Diversity-Driven Robust Vision-and-Language Navigation	Mar 16, 2026	—Unverified	0
SFCoT: Safer Chain-of-Thought via Active Safety Evaluation and Calibration	Mar 16, 2026	—Unverified	0
Brain-Inspired Graph Multi-Agent Systems for LLM Reasoning	Mar 16, 2026	—Unverified	0
SKILLS: Structured Knowledge Injection for LLM-Driven Telecommunications Operations	Mar 16, 2026	—Unverified	0
Spectral Rectification for Parameter-Efficient Adaptation of Foundation Models in Colonoscopy Depth Estimation	Mar 16, 2026	—Unverified	0
Why AI systems don't learn and what to do about it: Lessons on autonomous learning from cognitive science	Mar 16, 2026	—Unverified	0
Efficient Morphology-Control Co-Design via Stackelberg Proximal Policy Optimization	Mar 16, 2026	—Unverified	0
Beyond the Covariance Trap: Unlocking Generalization in Same-Subject Knowledge Editing for Large Language Models	Mar 16, 2026	—Unverified	0
TrinityGuard: A Unified Framework for Safeguarding Multi-Agent Systems	Mar 16, 2026	—Unverified	0
SEA-Vision: A Multilingual Benchmark for Comprehensive Document and Scene Text Understanding in Southeast Asia	Mar 16, 2026	—Unverified	0
Local Urysohn Width: A Topological Complexity Measure for Classification	Mar 16, 2026	—Unverified	0
RESQ: A Unified Framework for REliability- and Security Enhancement of Quantized Deep Neural Networks	Mar 16, 2026	—Unverified	0
AnyCrowd: Instance-Isolated Identity-Pose Binding for Arbitrary Multi-Character Animation	Mar 16, 2026	—Unverified	0
Amplification Effects in Test-Time Reinforcement Learning: Safety and Reasoning Vulnerabilities	Mar 16, 2026	—Unverified	0
MA-VLCM: A Vision Language Critic Model for Value Estimation of Policies in Multi-Agent Team Settings	Mar 16, 2026	—Unverified	0
CLAG: Adaptive Memory Organization via Agent-Driven Clustering for Small Language Model Agents	Mar 16, 2026	—Unverified	0
Physics-informed fine-tuning of foundation models for partial differential equations	Mar 16, 2026	—Unverified	0
Real-Time Human Frontal View Synthesis from a Single Image	Mar 16, 2026	—Unverified	0
Music Genre Classification: A Comparative Analysis of Classical Machine Learning and Deep Learning Approaches	Mar 16, 2026	—Unverified	0
Evaluating Time Awareness and Cross-modal Active Perception of Large Models via 4D Escape Room Task	Mar 16, 2026	—Unverified	0
Anchor then Polish for Low-light Enhancement	Mar 16, 2026	—Unverified	0
TabKD: Tabular Knowledge Distillation through Interaction Diversity of Learned Feature Bins	Mar 16, 2026	—Unverified	0
Talk, Evaluate, Diagnose: User-aware Agent Evaluation with Automated Error Analysis	Mar 16, 2026	—Unverified	0
Grokking as a Variance-Limited Phase Transition: Spectral Gating and the Epsilon-Stability Threshold	Mar 16, 2026	—Unverified	0
Seeking SOTA: Time-Series Forecasting Must Adopt Taxonomy-Specific Evaluation to Dispel Illusory Gains	Mar 16, 2026	—Unverified	0
Not All Invariants Are Equal: Curating Training Data to Accelerate Program Verification with SLMs	Mar 16, 2026	—Unverified	0
FreeTalk: Emotional Topology-Free 3D Talking Heads	Mar 16, 2026	—Unverified	0
Building Trust in PINNs: Error Estimation through Finite Difference Methods	Mar 16, 2026	—Unverified	0
Vib2ECG: A Paired Chest-Lead SCG-ECG Dataset and Benchmark for ECG Reconstruction	Mar 16, 2026	—Unverified	0
DOT: Dynamic Knob Selection and Online Sampling for Automated Database Tuning	Mar 16, 2026	—Unverified	0
Bridging Local and Global Knowledge: Cascaded Mixture-of-Experts Learning for Near-Shortest Path Routing	Mar 16, 2026	—Unverified	0
Kimodo: Scaling Controllable Human Motion Generation	Mar 16, 2026	—Unverified	0
Severe Domain Shift in Skeleton-Based Action Recognition:A Study of Uncertainty Failure in Real-World Gym Environments	Mar 16, 2026	—Unverified	0
Computational Concept of the Psyche	Mar 16, 2026	—Unverified	0
Robust and Computationally Efficient Linear Contextual Bandits under Adversarial Corruption and Heavy-Tailed Noise	Mar 16, 2026	—Unverified	0
Position-Blind Ptychography: Viability of image reconstruction via data-driven variational inference	Mar 16, 2026	—Unverified	0
Tri-Prompting: Video Diffusion with Unified Control over Scene, Subject, and Motion	Mar 16, 2026	—Unverified	0
Mechanistic Origin of Moral Indifference in Language Models	Mar 16, 2026	—Unverified	0
Can large language models assist choice modelling? Insights into prompting strategies and current models capabilities	Mar 16, 2026	—Unverified	0
HorizonMath: Measuring AI Progress Toward Mathematical Discovery with Automatic Verification	Mar 16, 2026	—Unverified	1
No More Blind Spots: Learning Vision-Based Omnidirectional Bipedal Locomotion for Challenging Terrain	Mar 16, 2026	—Unverified	0
NanoFlux: Adversarial Dual-LLM Evaluation and Distillation For Multi-Domain Reasoning	Mar 16, 2026	—Unverified	0
A Dynamic Time Warping-Transfer Learning Approach to Transferring Knowledge in Stress-strain Behaviors from Polymers to Metals: An Affordable and Generalizable Additive Manufacturing Part Qualification Framework	Mar 16, 2026	—Unverified	0
Compressed Convolutional Attention: Efficient Attention in a Compressed Latent Space	Mar 16, 2026	—Unverified	0
Malice in Agentland: Down the Rabbit Hole of Backdoors in the AI Supply Chain	Mar 16, 2026	—Unverified	0
Tail Distribution of Regret in Optimistic Reinforcement Learning	Mar 16, 2026	—Unverified	0
MorphSeek: Fine-grained Latent Representation-Level Policy Optimization for Deformable Image Registration	Mar 16, 2026	—Unverified	0