The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3201–3250 of 659983 papers

Title	Date	Status
An End-to-End Framework for Functionality-Embedded Provenance Graph Construction and Threat Interpretation	Mar 17, 2026	—Unverified
Knowledge Localization in Mixture-of-Experts LLMs Using Cross-Lingual Inconsistency	Mar 17, 2026	—Unverified
When the Specification Emerges: Benchmarking Faithfulness Loss in Long-Horizon Coding Agents	Mar 17, 2026	—Unverified
SENSE: Efficient EEG-to-Text via Privacy-Preserving Semantic Retrieval	Mar 17, 2026	—Unverified
Pixel-level Counterfactual Contrastive Learning for Medical Image Segmentation	Mar 17, 2026	—Unverified
Hidden Clones: Exposing and Fixing Family Bias in Vision-Language Model Ensembles	Mar 17, 2026	—Unverified
MosaicMem: Hybrid Spatial Memory for Controllable Video World Models	Mar 17, 2026	—Unverified
Security Assessment and Mitigation Strategies for Large Language Models: A Comprehensive Defensive Framework	Mar 17, 2026	—Unverified
Topology-Preserving Deep Joint Source-Channel Coding for Semantic Communication	Mar 17, 2026	—Unverified
Personalized Fall Detection by Balancing Data with Selective Feedback Using Contrastive Learning	Mar 17, 2026	—Unverified
Intent Formalization: A Grand Challenge for Reliable Coding in the Age of AI Agents	Mar 17, 2026	—Unverified
GazeOnce360: Fisheye-Based 360° Multi-Person Gaze Estimation with Global-Local Feature Fusion	Mar 17, 2026	—Unverified
Quadratic Surrogate Attractor for Particle Swarm Optimization	Mar 17, 2026	—Unverified
SLAM Adversarial Lab: An Extensible Framework for Visual SLAM Robustness Evaluation under Adverse Conditions	Mar 17, 2026	—Unverified
PAuth - Precise Task-Scoped Authorization For Agents	Mar 17, 2026	—Unverified
Detecting Data Poisoning in Code Generation LLMs via Black-Box, Vulnerability-Oriented Scanning	Mar 17, 2026	—Unverified
Domain-informed explainable boosting machines for trustworthy lateral spread predictions	Mar 17, 2026	—Unverified
Catching rationalization in the act: detecting motivated reasoning before and after CoT via activation probing	Mar 17, 2026	—Unverified
Visual Product Search Benchmark	Mar 17, 2026	—Unverified
Abstraction as a Memory-Efficient Inductive Bias for Continual Learning	Mar 17, 2026	—Unverified
CODMAS: A Dialectic Multi-Agent Collaborative Framework for Structured RTL Optimization	Mar 17, 2026	—Unverified
OPERA: Online Data Pruning for Efficient Retrieval Model Adaptation	Mar 17, 2026	—Unverified
A scalable neural bundle map for multiphysics prediction in lithium-ion battery across varying configurations	Mar 17, 2026	—Unverified
AI Scientist via Synthetic Task Scaling	Mar 17, 2026	—Unverified
Alignment Makes Language Models Normative, Not Descriptive	Mar 17, 2026	—Unverified
Multilingual, Multimodal Pipeline for Creating Authentic and Structured Fact-Checked Claim Dataset	Mar 17, 2026	—Unverified
One-Shot Badminton Shuttle Detection for Mobile Robots	Mar 17, 2026	—Unverified
Gradient Atoms: Unsupervised Discovery, Attribution and Steering of Model Behaviors via Sparse Decomposition of Training Gradients	Mar 17, 2026	CodeCode Available
Manifold-Matching Autoencoders	Mar 17, 2026	—Unverified
RaDAR: Relation-aware Diffusion-Asymmetric Graph Contrastive Learning for Recommendation	Mar 17, 2026	—Unverified
PubTables-v2: A new large-scale dataset for full-page and multi-page table extraction	Mar 17, 2026	—Unverified
Robust Physics-Guided Diffusion for Full-Waveform Inversion	Mar 17, 2026	—Unverified
Optimal uncertainty bounds for multivariate kernel regression under bounded noise: A Gaussian process-based dual function	Mar 17, 2026	—Unverified
Breaking the Chain: A Causal Analysis of LLM Faithfulness to Intermediate Structures	Mar 17, 2026	—Unverified
VideoMatGen: PBR Materials through Joint Generative Modeling	Mar 17, 2026	—Unverified
Shielded Reinforcement Learning Under Dynamic Temporal Logic Constraints	Mar 17, 2026	—Unverified
Dual Stream Independence Decoupling for True Emotion Recognition under Masked Expressions	Mar 17, 2026	—Unverified
REAL: Regression-Aware Reinforcement Learning for LLM-as-a-Judge	Mar 17, 2026	—Unverified
On-Policy RL Meets Off-Policy Experts: Harmonizing Supervised Fine-Tuning and Reinforcement Learning via Dynamic Weighting	Mar 17, 2026	CodeCode Available
Distilling Feedback into Memory-as-a-Tool	Mar 17, 2026	—Unverified
A Lensless Polarization Camera	Mar 17, 2026	—Unverified
When AI Navigates the Fog of War	Mar 17, 2026	—Unverified
Exposing Blindspots: Cultural Bias Evaluation in Generative Image Models	Mar 17, 2026	—Unverified
SHAMISA: SHAped Modeling of Implicit Structural Associations for Self-supervised No-Reference Image Quality Assessment	Mar 17, 2026	—Unverified
Adaptive Contracts for Cost-Effective AI Delegation	Mar 17, 2026	—Unverified
From Natural Language to Executable Option Strategies via Large Language Models	Mar 17, 2026	—Unverified
Tabular LLMs for Interpretable Few-Shot Alzheimer's Disease Prediction with Multimodal Biomedical Data	Mar 17, 2026	CodeCode Available
Ethical Fairness without Demographics in Human-Centered AI	Mar 17, 2026	—Unverified
The Cost of Reasoning: Chain-of-Thought Induces Overconfidence in Vision-Language Models	Mar 17, 2026	—Unverified
Incongruent Positivity: When Miscalibrated Positivity Undermines Online Supportive Conversations	Mar 17, 2026	—Unverified