The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5601–5650 of 661570 papers

Title	Date	Status	Hype
Data-Local Autonomous LLM-Guided Neural Architecture Search for Multiclass Multimodal Time-Series Classification	Mar 16, 2026	—Unverified	0
Are Dilemmas and Conflicts in LLM Alignment Solvable? A View from Priority Graph	Mar 16, 2026	—Unverified	0
TurkicNLP: An NLP Toolkit for Turkic Languages	Mar 16, 2026	CodeCode Available	0
Context-Aware Sensor Modeling for Asynchronous Multi-Sensor Tracking in Stone Soup	Mar 16, 2026	—Unverified	0
How Vulnerable Are AI Agents to Indirect Prompt Injections? Insights from a Large-Scale Public Competition	Mar 16, 2026	—Unverified	1
Self-Improving Language Models for Evolutionary Program Synthesis: A Case Study on ARC-AGI	Mar 16, 2026	CodeCode Available	0
Breaking the SFT Plateau: Multimodal Structured Reinforcement Learning for Chart-to-Code Generation	Mar 16, 2026	—Unverified	0
ECHO: Ego-Centric modeling of Human-Object interactions	Mar 16, 2026	—Unverified	0
Limitations of Public Chest Radiography Datasets for Artificial Intelligence: Label Quality, Domain Shift, Bias and Evaluation Challenges	Mar 16, 2026	—Unverified	0
Track-On2: Enhancing Online Point Tracking with Memory	Mar 16, 2026	—Unverified	0
GlobalRAG: Enhancing Global Reasoning in Multi-hop Question Answering via Reinforcement Learning	Mar 16, 2026	—Unverified	0
EvoX: Meta-Evolution for Automated Discovery	Mar 16, 2026	—Unverified	0
Generative Visual Chain-of-Thought for Image Editing	Mar 16, 2026	—Unverified	0
Emotion is Not Just a Label: Latent Emotional Factors in LLM Processing	Mar 16, 2026	—Unverified	0
Planning as Goal Recognition: Deriving Heuristics from Intention Models - Extended Version	Mar 16, 2026	—Unverified	0
Dataset Distillation Efficiently Encodes Low-Dimensional Representations from Gradient-Based Learning of Non-Linear Tasks	Mar 16, 2026	—Unverified	0
Ablate and Rescue: A Causal Analysis of Residual Stream Hyper-Connections	Mar 16, 2026	—Unverified	0
FAR-Drive: Frame-AutoRegressive Video Generation in Closed-Loop Autonomous Driving	Mar 16, 2026	—Unverified	0
RS-WorldModel: a Unified Model for Remote Sensing Understanding and Future Sense Forecasting	Mar 16, 2026	—Unverified	0
FairMed-XGB: A Bayesian-Optimised Multi-Metric Framework with Explainability for Demographic Equity in Critical Healthcare Data	Mar 16, 2026	—Unverified	0
Bridging Scene Generation and Planning: Driving with World Model via Unifying Vision and Motion Representation	Mar 16, 2026	—Unverified	0
Interpretable Classification of Time Series Using Euler Characteristic Surfaces	Mar 16, 2026	—Unverified	0
Decomposing Probabilistic Scores: Reliability, Information Loss and Uncertainty	Mar 16, 2026	—Unverified	0
Data Augmentation via Causal-Residual Bootstrapping	Mar 16, 2026	—Unverified	0
From Passive Observer to Active Critic: Reinforcement Learning Elicits Process Reasoning for Robotic Manipulation	Mar 16, 2026	—Unverified	0
Fast SAM 3D Body: Accelerating SAM 3D Body for Real-Time Full-Body Human Mesh Recovery	Mar 16, 2026	—Unverified	0
SEMAG: Self-Evolutionary Multi-Agent Code Generation	Mar 16, 2026	—Unverified	0
FEEL (Force-Enhanced Egocentric Learning): A Dataset for Physical Action Understanding	Mar 16, 2026	—Unverified	0
VIBEPASS: Can Vibe Coders Really Pass the Vibe Check?	Mar 16, 2026	—Unverified	0
Deriving Hyperparameter Scaling Laws via Modern Optimization Theory	Mar 16, 2026	—Unverified	0
E2EGS: Event-to-Edge Gaussian Splatting for Pose-Free 3D Reconstruction	Mar 16, 2026	—Unverified	0
Visual Confused Deputy: Exploiting and Defending Perception Failures in Computer-Using Agents	Mar 16, 2026	CodeCode Available	0
ReasoningBank: Scaling Agent Self-Evolving with Reasoning Memory	Mar 16, 2026	CodeCode Available	0
Fractal Autoregressive Depth Estimation with Continuous Token Diffusion	Mar 16, 2026	—Unverified	0
Video-CoE: Reinforcing Video Event Prediction via Chain of Events	Mar 16, 2026	—Unverified	0
SimCert: Probabilistic Certification for Behavioral Similarity in Deep Neural Network Compression	Mar 16, 2026	—Unverified	0
EventGPT: Capturing Player Impact from Team Action Sequences Using GPT-Based Framework	Mar 16, 2026	—Unverified	0
Chain-of-Trajectories: Unlocking the Intrinsic Generative Optimality of Diffusion Models via Graph-Theoretic Planning	Mar 16, 2026	CodeCode Available	0
Efficient Construction of Model Family through Progressive Training Using Model Expansion	Mar 16, 2026	—Unverified	0
MARVL: Multi-Stage Guidance for Robotic Manipulation via Vision-Language Models	Mar 16, 2026	—Unverified	0
Experimental evidence of progressive ChatGPT models self-convergence	Mar 16, 2026	—Unverified	0
3DTCR: A Physics-Based Generative Framework for Vortex-Following 3D Reconstruction to Improve Tropical Cyclone Intensity Forecasting	Mar 16, 2026	—Unverified	0
Architecture-Agnostic Feature Synergy for Universal Defense Against Heterogeneous Generative Threats	Mar 16, 2026	—Unverified	0
Riemannian Motion Generation: A Unified Framework for Human Motion Representation and Generation via Riemannian Flow Matching	Mar 16, 2026	—Unverified	0
FuXiWeather2: Learning accurate atmospheric state estimation for operational global weather forecasting	Mar 16, 2026	—Unverified	0
Benchmarking Machine Learning Approaches for Polarization Mapping in Ferroelectrics Using 4D-STEM	Mar 16, 2026	—Unverified	0
Machine Translation in the Wild: User Reaction to Xiaohongshu's Built-In Translation Feature	Mar 16, 2026	—Unverified	0
Lost in Aggregation: On a Fundamental Expressivity Limit of Message-Passing Graph Neural Networks	Mar 16, 2026	—Unverified	0
FlatLands: Generative Floormap Completion From a Single Egocentric View	Mar 16, 2026	—Unverified	0
Prose2Policy (P2P): A Practical LLM Pipeline for Translating Natural-Language Access Policies into Executable Rego	Mar 16, 2026	—Unverified	0