The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12001–12050 of 661570 papers

Title	Date	Status	Hype
Real-time tightly coupled GNSS and IMU integration via Factor Graph Optimization	Mar 3, 2026	—Unverified	0
Role-Aware Conditional Inference for Spatiotemporal Ecosystem Carbon Flux Prediction	Mar 3, 2026	—Unverified	0
Trade-offs in Ensembling, Merging and Routing Among Parameter-Efficient Experts	Mar 3, 2026	—Unverified	0
SafeCRS: Personalized Safety Alignment for LLM-Based Conversational Recommender Systems	Mar 3, 2026	—Unverified	0
Online Learnability of Chain-of-Thought Verifiers: Soundness and Completeness Trade-offs	Mar 3, 2026	—Unverified	0
RAG-X: Systematic Diagnosis of Retrieval-Augmented Generation for Medical Question Answering	Mar 3, 2026	—Unverified	0
Tucano 2 Cool: Better Open Source LLMs for Portuguese	Mar 3, 2026	—Unverified	0
PinCLIP: Large-scale Foundational Multimodal Representation at Pinterest	Mar 3, 2026	—Unverified	0
Real-time loosely coupled GNSS and IMU integration via Factor Graph Optimization	Mar 3, 2026	—Unverified	0
Modeling Cross-vision Synergy for Unified Large Vision Model	Mar 3, 2026	—Unverified	0
Build, Judge, Optimize: A Blueprint for Continuous Improvement of Multi-Agent Consumer Assistants	Mar 3, 2026	—Unverified	0
Confidence-aware Monocular Depth Estimation for Minimally Invasive Surgery	Mar 3, 2026	—Unverified	0
Transport Clustering: Solving Low-Rank Optimal Transport via Clustering	Mar 3, 2026	—Unverified	0
Spectrum Shortage for Radio Sensing? Leveraging Ambient 5G Signals for Human Activity Detection	Mar 3, 2026	—Unverified	0
ByteFlow: Language Modeling through Adaptive Byte Compression without a Tokenizer	Mar 3, 2026	—Unverified	0
Hazard-Aware Traffic Scene Graph Generation	Mar 3, 2026	—Unverified	0
Controllable Generative Sandbox for Causal Inference	Mar 3, 2026	—Unverified	0
Social Norm Reasoning in Multimodal Language Models: An Evaluation	Mar 3, 2026	—Unverified	0
SENTINEL: Stagewise Integrity Verification for Pipeline Parallel Decentralized Training	Mar 3, 2026	—Unverified	0
Infinite dimensional generative sensing	Mar 3, 2026	—Unverified	0
From Local Matches to Global Masks: Novel Instance Detection in Open-World Scenes	Mar 3, 2026	—Unverified	0
Joint Training Across Multiple Activation Sparsity Regimes	Mar 3, 2026	—Unverified	0
Safety Verification of Wait-Only Non-Blocking Broadcast Protocols	Mar 3, 2026	—Unverified	0
Learning to Weigh Waste: A Physics-Informed Multimodal Fusion Framework and Large-Scale Dataset for Commercial and Industrial Applications	Mar 3, 2026	—Unverified	0
From Complex Dynamics to DynFormer: Rethinking Transformers for PDEs	Mar 3, 2026	—Unverified	0
PRIVATEEDIT: A Privacy-Preserving Pipeline for Face-Centric Generative Image Editing	Mar 3, 2026	CodeCode Available	0
Designing UNICORN: a Unified Benchmark for Imaging in Computational Pathology, Radiology, and Natural Language	Mar 3, 2026	—Unverified	0
TagaVLM: Topology-Aware Global Action Reasoning for Vision-Language Navigation	Mar 3, 2026	—Unverified	0
TC-Padé: Trajectory-Consistent Padé Approximation for Diffusion Acceleration	Mar 3, 2026	—Unverified	0
Navigating with Annealing Guidance Scale in Diffusion Space	Mar 3, 2026	—Unverified	0
MiM-DiT: MoE in MoE with Diffusion Transformers for All-in-One Image Restoration	Mar 3, 2026	—Unverified	0
Graph Homomorphism Distortion: A Metric to Distinguish Them All and in the Latent Space Bind Them	Mar 3, 2026	—Unverified	0
Chain of World: World Model Thinking in Latent Motion	Mar 3, 2026	—Unverified	1
Generative adversarial imitation learning for robot swarms: Learning from human demonstrations and trained policies	Mar 3, 2026	—Unverified	0
ScribeTokens: Fixed-Vocabulary Tokenization of Digital Ink	Mar 3, 2026	—Unverified	0
Implicit Bias in Deep Linear Discriminant Analysis	Mar 3, 2026	—Unverified	0
Impact of Localization Errors on Label Quality for Online HD Map Construction	Mar 3, 2026	—Unverified	0
[Re] FairDICE: A Gap Between Theory And Practice	Mar 3, 2026	—Unverified	0
ChemFlow:A Hierarchical Neural Network for Multiscale Representation Learning in Chemical Mixtures	Mar 3, 2026	—Unverified	0
Even Faster Kernel Matrix Linear Algebra via Density Estimation	Mar 3, 2026	—Unverified	0
Linear Model Extraction via Factual and Counterfactual Queries	Mar 3, 2026	—Unverified	0
Bridging the Gap Between Promise and Performance for Microscaling FP4 Quantization	Mar 3, 2026	—Unverified	2
Thermodynamic Regulation of Finite-Time Gibbs Training in Energy-Based Models: A Restricted Boltzmann Machine Study	Mar 3, 2026	—Unverified	0
PhyPrompt: RL-based Prompt Refinement for Physically Plausible Text-to-Video Generation	Mar 3, 2026	—Unverified	0
Boosted Trees on a Diet: Compact Models for Resource-Constrained Devices	Mar 3, 2026	—Unverified	0
No Text Needed: Forecasting MT Quality and Inequity from Fertility and Metadata	Mar 3, 2026	—Unverified	0
FAST: Topology-Aware Frequency-Domain Distribution Matching for Coreset Selection	Mar 3, 2026	—Unverified	0
MA-CoNav: A Master-Slave Multi-Agent Framework with Hierarchical Collaboration and Dual-Level Reflection for Long-Horizon Embodied VLN	Mar 3, 2026	—Unverified	0
Can LLMs Discern the Traits Influencing Your Preferences? Evaluating Personality-Driven Preference Alignment in LLMs	Mar 3, 2026	—Unverified	0
Training-Free Multi-Concept Image Editing	Mar 3, 2026	—Unverified	0