The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3451–3500 of 659983 papers

Title	Date	Status
Noisy Data is Destructive to Reinforcement Learning with Verifiable Rewards	Mar 17, 2026	—Unverified
Structure-Aware Multimodal LLM Framework for Trustworthy Near-Field Beam Prediction	Mar 17, 2026	—Unverified
Deep Adaptive Model-Based Design of Experiments	Mar 17, 2026	—Unverified
Dual Consensus: Escaping from Spurious Majority in Unsupervised RLVR via Two-Stage Vote Mechanism	Mar 17, 2026	—Unverified
Speak, Segment, Track, Navigate: An Interactive System for Video-Guided Skull-Base Surgery	Mar 17, 2026	—Unverified
3D tomography of exchange phase in a Si/SiGe quantum dot device	Mar 17, 2026	—Unverified
POaaS: Minimal-Edit Prompt Optimization as a Service to Lift Accuracy and Cut Hallucinations on On-Device sLLMs	Mar 17, 2026	—Unverified
The Era of End-to-End Autonomy: Transitioning from Rule-Based Driving to Large Driving Models	Mar 17, 2026	—Unverified
Volumetrically Consistent Implicit Atlas Learning via Neural Diffeomorphic Flow for Placenta MRI	Mar 17, 2026	—Unverified
A Context Alignment Pre-processor for Enhancing the Coherence of Human-LLM Dialog	Mar 17, 2026	—Unverified
Safe Distributionally Robust Feature Selection under Covariate Shift	Mar 17, 2026	—Unverified
Diffusion Models for Joint Audio-Video Generation	Mar 17, 2026	—Unverified
Reevaluating the Intra-Modal Misalignment Hypothesis in CLIP	Mar 17, 2026	—Unverified
ViT-AdaLA: Adapting Vision Transformers with Linear Attention	Mar 17, 2026	—Unverified
Adaptive regularization parameter selection for high-dimensional inverse problems: A Bayesian approach with Tucker low-rank constraints	Mar 17, 2026	—Unverified
Structured prototype regularization for synthetic-to-real driving scene parsing	Mar 17, 2026	—Unverified
Attribution Upsampling should Redistribute, Not Interpolate	Mar 17, 2026	—Unverified
SEAHateCheck: Functional Tests for Detecting Hate Speech in Low-Resource Languages of Southeast Asia	Mar 17, 2026	—Unverified
ClaimFlow: Tracing the Evolution of Scientific Claims in NLP	Mar 17, 2026	—Unverified
Interact3D: Compositional 3D Generation of Interactive Objects	Mar 17, 2026	—Unverified
Parallel In-context Learning for Large Vision Language Models	Mar 17, 2026	—Unverified
NanoGS: Training-Free Gaussian Splat Simplification	Mar 17, 2026	—Unverified
Frequency Matters: Fast Model-Agnostic Data Curation for Pruning and Quantization	Mar 17, 2026	—Unverified
ASDA: Automated Skill Distillation and Adaptation for Financial Reasoning	Mar 17, 2026	—Unverified
Out-of-Distribution Object Detection in Street Scenes via Synthetic Outlier Exposure and Transfer Learning	Mar 17, 2026	—Unverified
Functorial Neural Architectures from Higher Inductive Types	Mar 17, 2026	—Unverified
The Finetuner's Fallacy: When to Pretrain with Your Finetuning Data	Mar 17, 2026	—Unverified
Boosting Quantitive and Spatial Awareness for Zero-Shot Object Counting	Mar 17, 2026	—Unverified
DualPrim: Compact 3D Reconstruction with Positive and Negative Primitives	Mar 17, 2026	—Unverified
Communication-Aware Multi-Agent Reinforcement Learning for Decentralized Cooperative UAV Deployment	Mar 17, 2026	—Unverified
GATS: Gaussian Aware Temporal Scaling Transformer for Invariant 4D Spatio-Temporal Point Cloud Representation	Mar 17, 2026	—Unverified
DyJR: Preserving Diversity in Reinforcement Learning with Verifiable Rewards via Dynamic Jensen-Shannon Replay	Mar 17, 2026	—Unverified
Segmentation-before-Staining Improves Structural Fidelity in Virtual IHC-to-Multiplex IF Translation	Mar 17, 2026	—Unverified
SQL-ASTRA: Alleviating Sparse Feedback in Agentic SQL via Column-Set Matching and Trajectory Aggregation	Mar 17, 2026	—Unverified
SignNav: Leveraging Signage for Semantic Visual Navigation in Large-Scale Indoor Environments	Mar 17, 2026	—Unverified
360° Image Perception with MLLMs: A Comprehensive Benchmark and a Training-Free Method	Mar 17, 2026	—Unverified
KidsNanny: A Two-Stage Multimodal Content Moderation Pipeline Integrating Visual Classification, Object Detection, OCR, and Contextual Reasoning for Child Safety	Mar 17, 2026	—Unverified
Sample-Efficient Adaptation of Drug-Response Models to Patient Tumors under Strong Biological Domain Shift	Mar 17, 2026	—Unverified
Are Large Language Models Truly Smarter Than Humans?	Mar 17, 2026	—Unverified
A Scoping Review of AI-Driven Digital Interventions in Mental Health Care: Mapping Applications Across Screening, Support, Monitoring, Prevention, and Clinical Education	Mar 17, 2026	—Unverified
Offline Exploration-Aware Fine-Tuning for Long-Chain Mathematical Reasoning	Mar 17, 2026	—Unverified
Leveling3D: Leveling Up 3D Reconstruction with Feed-Forward 3D Gaussian Splatting and Geometry-Aware Generation	Mar 17, 2026	—Unverified
SpecSteer: Synergizing Local Context and Global Reasoning for Efficient Personalized Generation	Mar 17, 2026	—Unverified
Ground Reaction Inertial Poser: Physics-based Human Motion Capture from Sparse IMUs and Insole Pressure Sensors	Mar 17, 2026	—Unverified
Exclusivity-Guided Mask Learning for Semi-Supervised Crowd Instance Segmentation and Counting	Mar 17, 2026	—Unverified
RASLF: Representation-Aware State Space Model for Light Field Super-Resolution	Mar 17, 2026	—Unverified
More Rounds, More Noise: Why Multi-Turn Review Fails to Improve Cross-Context Verification	Mar 17, 2026	—Unverified
Visual Prompt Discovery via Semantic Exploration	Mar 17, 2026	—Unverified
When Thinking Hurts: Mitigating Visual Forgetting in Video Reasoning via Frame Repetition	Mar 17, 2026	—Unverified
Is Semi-Automatic Transcription Useful in Corpus Creation? Preliminary Considerations on the KIParla Corpus	Mar 17, 2026	—Unverified