The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5601–5625 of 661570 papers

Title	Date	Status	Hype
Data-Local Autonomous LLM-Guided Neural Architecture Search for Multiclass Multimodal Time-Series Classification	Mar 16, 2026	—Unverified	0
Are Dilemmas and Conflicts in LLM Alignment Solvable? A View from Priority Graph	Mar 16, 2026	—Unverified	0
TurkicNLP: An NLP Toolkit for Turkic Languages	Mar 16, 2026	CodeCode Available	0
Context-Aware Sensor Modeling for Asynchronous Multi-Sensor Tracking in Stone Soup	Mar 16, 2026	—Unverified	0
How Vulnerable Are AI Agents to Indirect Prompt Injections? Insights from a Large-Scale Public Competition	Mar 16, 2026	—Unverified	1
Self-Improving Language Models for Evolutionary Program Synthesis: A Case Study on ARC-AGI	Mar 16, 2026	CodeCode Available	0
Breaking the SFT Plateau: Multimodal Structured Reinforcement Learning for Chart-to-Code Generation	Mar 16, 2026	—Unverified	0
ECHO: Ego-Centric modeling of Human-Object interactions	Mar 16, 2026	—Unverified	0
Limitations of Public Chest Radiography Datasets for Artificial Intelligence: Label Quality, Domain Shift, Bias and Evaluation Challenges	Mar 16, 2026	—Unverified	0
Track-On2: Enhancing Online Point Tracking with Memory	Mar 16, 2026	—Unverified	0
GlobalRAG: Enhancing Global Reasoning in Multi-hop Question Answering via Reinforcement Learning	Mar 16, 2026	—Unverified	0
EvoX: Meta-Evolution for Automated Discovery	Mar 16, 2026	—Unverified	0
Generative Visual Chain-of-Thought for Image Editing	Mar 16, 2026	—Unverified	0
Emotion is Not Just a Label: Latent Emotional Factors in LLM Processing	Mar 16, 2026	—Unverified	0
Planning as Goal Recognition: Deriving Heuristics from Intention Models - Extended Version	Mar 16, 2026	—Unverified	0
Dataset Distillation Efficiently Encodes Low-Dimensional Representations from Gradient-Based Learning of Non-Linear Tasks	Mar 16, 2026	—Unverified	0
Ablate and Rescue: A Causal Analysis of Residual Stream Hyper-Connections	Mar 16, 2026	—Unverified	0
FAR-Drive: Frame-AutoRegressive Video Generation in Closed-Loop Autonomous Driving	Mar 16, 2026	—Unverified	0
RS-WorldModel: a Unified Model for Remote Sensing Understanding and Future Sense Forecasting	Mar 16, 2026	—Unverified	0
FairMed-XGB: A Bayesian-Optimised Multi-Metric Framework with Explainability for Demographic Equity in Critical Healthcare Data	Mar 16, 2026	—Unverified	0
Bridging Scene Generation and Planning: Driving with World Model via Unifying Vision and Motion Representation	Mar 16, 2026	—Unverified	0
Interpretable Classification of Time Series Using Euler Characteristic Surfaces	Mar 16, 2026	—Unverified	0
Decomposing Probabilistic Scores: Reliability, Information Loss and Uncertainty	Mar 16, 2026	—Unverified	0
Data Augmentation via Causal-Residual Bootstrapping	Mar 16, 2026	—Unverified	0
From Passive Observer to Active Critic: Reinforcement Learning Elicits Process Reasoning for Robotic Manipulation	Mar 16, 2026	—Unverified	0