The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6151–6200 of 661570 papers

Title	Date	Status
Towards One-for-All Anomaly Detection for Tabular Data	Mar 15, 2026	—Unverified
End-to-End Spatial-Temporal Transformer for Real-time 4D HOI Reconstruction	Mar 15, 2026	—Unverified
An Industrial-Scale Insurance LLM Achieving Verifiable Domain Mastery and Hallucination Control without Competence Trade-offs	Mar 15, 2026	—Unverified
Physics-Informed Policy Optimization via Analytic Dynamics Regularization	Mar 15, 2026	—Unverified
Wi-Spike: A Low-power WiFi Human Multi-action Recognition Model with Spiking Neural Networks	Mar 15, 2026	—Unverified
Disentangling Dynamical Systems: Causal Representation Learning Meets Local Sparse Attention	Mar 15, 2026	—Unverified
Predicting Stress-strain Behaviors of Additively Manufactured Materials via Loss-based and Activation-based Physics-informed Machine Learning	Mar 15, 2026	—Unverified
R3DP: Real-Time 3D-Aware Policy for Embodied Manipulation	Mar 15, 2026	—Unverified
Unlocking the Latent Canvas: Eliciting and Benchmarking Symbolic Visual Expression in LLMs	Mar 15, 2026	—Unverified
Interp3R: Continuous-time 3D Geometry Estimation with Frames and Events	Mar 15, 2026	—Unverified
Visualizing Critic Match Loss Landscapes for Interpretation of Online Reinforcement Learning Control Algorithms	Mar 15, 2026	—Unverified
IQP Born Machines under Data-dependent and Agnostic Initialization Strategies	Mar 15, 2026	—Unverified
Texel Splatting: Perspective-Stable 3D Pixel Art	Mar 15, 2026	—Unverified
PA^3: Policy-Aware Agent Alignment through Chain-of-Thought	Mar 15, 2026	—Unverified
Tactile Modality Fusion for Vision-Language-Action Models	Mar 15, 2026	—Unverified
ResearchPilot: A Local-First Multi-Agent System for Literature Synthesis and Related Work Drafting	Mar 15, 2026	—Unverified
Early Failure Detection and Intervention in Video Diffusion Models	Mar 15, 2026	—Unverified
Emergent Coordination in Multi-Agent Language Models	Mar 15, 2026	—Unverified
More Agents Improve Math Problem Solving but Adversarial Robustness Gap Persists	Mar 15, 2026	—Unverified
Vavanagi: a Community-run Platform for Documentation of the Hula Language in Papua New Guinea	Mar 15, 2026	—Unverified
A Physically-Grounded Attack and Adaptive Defense Framework for Real-World Low-Light Image Enhancement	Mar 15, 2026	CodeCode Available
Seeking Physics in Diffusion Noise	Mar 15, 2026	—Unverified
An End-to-end Architecture for Collider Physics and Beyond	Mar 15, 2026	—Unverified
The Scenic Route to Deception: Dark Patterns and Explainability Pitfalls in Conversational Navigation	Mar 15, 2026	—Unverified
Agentic DAG-Orchestrated Planner Framework for Multi-Modal, Multi-Hop Question Answering in Hybrid Data Lakes	Mar 15, 2026	—Unverified
Deep probabilistic model synthesis enables unified modeling of whole-brain neural activity across individual subjects	Mar 15, 2026	—Unverified
Rethinking Evaluation in Retrieval-Augmented Personalized Dialogue: A Cognitive and Linguistic Perspective	Mar 15, 2026	—Unverified
Survey on Neural Routing Solvers	Mar 15, 2026	—Unverified
AEX: Non-Intrusive Multi-Hop Attestation and Provenance for LLM APIs	Mar 15, 2026	—Unverified
MOSAIC: Multi-agent Orchestration for Task-Intelligent Scientific Coding	Mar 15, 2026	—Unverified
How to find expressible and trainable parameterized quantum circuits?	Mar 15, 2026	—Unverified
Top-b: Entropic Regulation of Relative Probability Bands in Autoregressive Language Processes	Mar 15, 2026	—Unverified
Co-rewarding: Stable Self-supervised RL for Eliciting Reasoning in Large Language Models	Mar 15, 2026	CodeCode Available
Extending Foundational Monocular Depth Estimators to Fisheye Cameras with Calibration Tokens	Mar 15, 2026	CodeCode Available
Faithful Bi-Directional Model Steering via Distribution Matching and Distributed Interchange Interventions	Mar 15, 2026	CodeCode Available
A Coin Flip for Safety: LLM Judges Fail to Reliably Measure Adversarial Robustness	Mar 15, 2026	CodeCode Available
GoldenStart: Q-Guided Priors and Entropy Control for Distilling Flow Policies	Mar 15, 2026	CodeCode Available
Bridging the Gap in the Responsible AI Divides	Mar 15, 2026	CodeCode Available
CangjieBench: Benchmarking LLMs on a Low-Resource General-Purpose Programming Language	Mar 15, 2026	CodeCode Available
Representation Alignment for Just Image Transformers is not Easier than You Think	Mar 15, 2026	CodeCode Available
DC-Merge: Improving Model Merging with Directional Consistency	Mar 15, 2026	CodeCode Available
OneOcc: Semantic Occupancy Prediction for Legged Robots with a Single Panoramic Camera	Mar 15, 2026	CodeCode Available
ECG-Reasoning-Benchmark: A Benchmark for Evaluating Clinical Reasoning Capabilities in ECG Interpretation	Mar 15, 2026	CodeCode Available
HomeGuard: VLM-based Embodied Safeguard for Identifying Contextual Risk in Household Task	Mar 15, 2026	CodeCode Available
Joint Segmentation and Grading with Iterative Optimization for Multimodal Glaucoma Diagnosis	Mar 15, 2026	CodeCode Available
Self-transcendence: Is External Feature Guidance Indispensable for Accelerating Diffusion Transformer Training?	Mar 15, 2026	CodeCode Available
Unsupervised Online 3D Instance Segmentation with Synthetic Sequences and Dynamic Loss	Mar 15, 2026	CodeCode Available
PREDICT-GBM: A multi-center platform to advance personalized glioblastoma radiotherapy planning	Mar 15, 2026	CodeCode Available
Null-Space Filtering for Data-Free Continual Model Merging: Preserving Stability, Promoting Plasticity	Mar 15, 2026	CodeCode Available
Towards Understanding Valuable Preference Data for Large Language Model Alignment	Mar 15, 2026	CodeCode Available