The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8951–9000 of 661570 papers

Title	Date	Status	Hype
Toward Unified Multimodal Representation Learning for Autonomous Driving	Mar 9, 2026	—Unverified	0
What Do AI Agents Talk About? Emergent Communication Structure in the First AI-Only Social Network	Mar 9, 2026	—Unverified	0
Local Constrained Bayesian Optimization	Mar 9, 2026	—Unverified	0
CCR-Bench: A Comprehensive Benchmark for Evaluating LLMs on Complex Constraints, Control Flows, and Real-World Cases	Mar 9, 2026	—Unverified	0
MINT: Molecularly Informed Training with Spatial Transcriptomics Supervision for Pathology Foundation Models	Mar 9, 2026	—Unverified	0
SMGI: A Structural Theory of General Artificial Intelligence	Mar 9, 2026	—Unverified	0
LeJOT-AutoML: LLM-Driven Feature Engineering for Job Execution Time Prediction in Databricks Cost Optimization	Mar 9, 2026	—Unverified	0
EveryQuery: Zero-Shot Clinical Prediction via Task-Conditioned Pretraining over Electronic Health Records	Mar 9, 2026	—Unverified	0
Long-Short Term Agents for Pure-Vision Bronchoscopy Robotic Autonomy	Mar 9, 2026	—Unverified	0
Ares: Adaptive Reasoning Effort Selection for Efficient LLM Agents	Mar 9, 2026	—Unverified	0
Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases	Mar 9, 2026	—Unverified	0
RLPR: Radar-to-LiDAR Place Recognition via Two-Stage Asymmetric Cross-Modal Alignment for Autonomous Driving	Mar 9, 2026	—Unverified	0
Robust Transfer Learning with Side Information	Mar 9, 2026	—Unverified	0
SWE-Fuse: Empowering Software Agents via Issue-free Trajectory Learning and Entropy-aware RLVR Training	Mar 9, 2026	—Unverified	0
Text to Automata Diagrams: Comparing TikZ Code Generation with Direct Image Synthesis	Mar 9, 2026	—Unverified	0
Advancing Automated Algorithm Design via Evolutionary Stagewise Design with LLMs	Mar 9, 2026	—Unverified	0
AutoTraces: Autoregressive Trajectory Forecasting via Multimodal Large Language Models	Mar 9, 2026	—Unverified	0
Adaptive Collaboration with Humans: Metacognitive Policy Optimization for Multi-Agent LLMs with Continual Learning	Mar 9, 2026	—Unverified	0
VORL-EXPLORE: A Hybrid Learning Planning Approach to Multi-Robot Exploration in Dynamic Environments	Mar 9, 2026	—Unverified	0
OSExpert: Computer-Use Agents Learning Professional Skills via Exploration	Mar 9, 2026	—Unverified	0
Emergence is Overrated: AGI as an Archipelago of Experts	Mar 9, 2026	—Unverified	0
Extend Your Horizon: A Device-Agnostic Surgical Tool Tracking Framework with Multi-View Optimization for Augmented Reality	Mar 9, 2026	—Unverified	0
On the Feasibility and Opportunity of Autoregressive 3D Object Detection	Mar 9, 2026	—Unverified	0
TeamHOI: Learning a Unified Policy for Cooperative Human-Object Interactions with Any Team Size	Mar 9, 2026	—Unverified	1
MJ1: Multimodal Judgment via Grounded Verification	Mar 9, 2026	—Unverified	0
CMMR-VLN: Vision-and-Language Navigation via Continual Multimodal Memory Retrieval	Mar 9, 2026	—Unverified	0
Amortizing Maximum Inner Product Search with Learned Support Functions	Mar 9, 2026	—Unverified	0
It's Time to Get It Right: Improving Analog Clock Reading and Clock-Hand Spatial Reasoning in Vision-Language Models	Mar 9, 2026	—Unverified	0
PIRA-Bench: A Transition from Reactive GUI Agents to GUI-based Proactive Intent Recommendation Agents	Mar 9, 2026	—Unverified	0
VSDiffusion: Taming Ill-Posed Shadow Generation via Visibility-Constrained Diffusion	Mar 9, 2026	—Unverified	0
AffordGrasp: Cross-Modal Diffusion for Affordance-Aware Grasp Synthesis	Mar 9, 2026	—Unverified	0
Not Like Transformers: Drop the Beat Representation for Dance Generation with Mamba-Based Diffusion Model	Mar 9, 2026	—Unverified	0
Learning Hierarchical Knowledge in Text-Rich Networks with Taxonomy-Informed Representation Learning	Mar 9, 2026	—Unverified	0
Controllable Complex Human Motion Video Generation via Text-to-Skeleton Cascades	Mar 9, 2026	—Unverified	0
QualiTeacher: Quality-Conditioned Pseudo-Labeling for Real-World Image Restoration	Mar 9, 2026	—Unverified	0
GCGNet: Graph-Consistent Generative Network for Time Series Forecasting with Exogenous Variables	Mar 9, 2026	—Unverified	0
Solution to the 10th ABAW Expression Recognition Challenge: A Robust Multimodal Framework with Safe Cross-Attention and Modality Dropout	Mar 9, 2026	—Unverified	0
CDRRM: Contrast-Driven Rubric Generation for Reliable and Interpretable Reward Modeling	Mar 9, 2026	—Unverified	0
S2S-FDD: Bridging Industrial Time Series and Natural Language for Explainable Zero-shot Fault Diagnosis	Mar 9, 2026	—Unverified	0
Stabilized Fine-Tuning with LoRA in Federated Learning: Mitigating the Side Effect of Client Size and Rank via the Scaling Factor	Mar 9, 2026	—Unverified	0
ImageEdit-R1: Boosting Multi-Agent Image Editing via Reinforcement Learning	Mar 9, 2026	—Unverified	0
Adversarial Domain Adaptation Enables Knowledge Transfer Across Heterogeneous RNA-Seq Datasets	Mar 9, 2026	—Unverified	0
Enhancing Cross-View UAV Geolocalization via LVLM-Driven Relational Modeling	Mar 9, 2026	—Unverified	0
Synthetic Defect Image Generation for Power Line Insulator Inspection Using Multimodal Large Language Models	Mar 9, 2026	—Unverified	0
Hybrid Quantum Neural Network for Multivariate Clinical Time Series Forecasting	Mar 9, 2026	—Unverified	0
Wiener Chaos Expansion based Neural Operator for Singular Stochastic Partial Differential Equations	Mar 9, 2026	—Unverified	0
Tiny Autoregressive Recursive Models	Mar 9, 2026	—Unverified	0
From Reactive to Map-Based AI: Tuned Local LLMs for Semantic Zone Inference in Object-Goal Navigation	Mar 9, 2026	—Unverified	0
EAGLE-Pangu: Accelerator-Safe Tree Speculative Decoding on Ascend NPUs	Mar 9, 2026	—Unverified	0
DSH-Bench: A Difficulty- and Scenario-Aware Benchmark with Hierarchical Subject Taxonomy for Subject-Driven Text-to-Image Generation	Mar 9, 2026	—Unverified	0