The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

659,983 papers248,104 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1051–1100 of 659983 papers

Title	Date	Status
WIST: Web-Grounded Iterative Self-Play Tree for Domain-Targeted Reasoning Improvement	Mar 22, 2026	—Unverified
Demystifying Low-Rank Knowledge Distillation in Large Language Models: Convergence, Generalization, and Information-Theoretic Guarantees	Mar 22, 2026	—Unverified
Bridging neuroscience and AI: adaptive, culturally sensitive technologies transforming aphasia rehabilitation	Mar 22, 2026	—Unverified
STEM Agent: A Self-Adapting, Tool-Enabled, Extensible Architecture for Multi-Protocol AI Agent Systems	Mar 22, 2026	—Unverified
ECI: Effective Contrastive Information to Evaluate Hard-Negatives	Mar 22, 2026	—Unverified
Structural Sensitivity in Compressed Transformers: Error Propagation, Lyapunov Stability, and Formally Verified Bounds	Mar 22, 2026	—Unverified
Long-Term Outlier Prediction Through Outlier Score Modeling	Mar 22, 2026	—Unverified
The Intelligent Disobedience Game: Formulating Disobedience in Stackelberg Games and Markov Decision Processes	Mar 22, 2026	—Unverified
When Does Content-Based Routing Work? Representation Requirements for Selective Attention in Hybrid Sequence Models	Mar 22, 2026	—Unverified
CLT-Forge: A Scalable Library for Cross-Layer Transcoders and Attribution Graphs	Mar 22, 2026	—Unverified
Mitigating Selection Bias in Large Language Models via Permutation-Aware GRPO	Mar 22, 2026	—Unverified
SpatialFly: Geometry-Guided Representation Alignment for UAV Vision-and-Language Navigation in Urban Environments	Mar 22, 2026	—Unverified
When Minor Edits Matter: LLM-Driven Prompt Attack for Medical VLM Robustness in Ultrasound	Mar 22, 2026	—Unverified
NoOVD: Novel Category Discovery and Embedding for Open-Vocabulary Object Detection	Mar 22, 2026	—Unverified
CTFS : Collaborative Teacher Framework for Forward-Looking Sonar Image Semantic Segmentation with Extremely Limited Labels	Mar 22, 2026	—Unverified
SqueezeComposer: Temporal Speed-up is A Simple Trick for Long-form Music Composing	Mar 22, 2026	—Unverified
CoVFT: Context-aware Visual Fine-tuning for Multimodal Large Language Models	Mar 22, 2026	—Unverified
Assessing the Ability of Neural TTS Systems to Model Consonant-Induced F0 Perturbation	Mar 22, 2026	—Unverified
Hierarchical Text-Guided Brain Tumor Segmentation via Sub-Region-Aware Prompts	Mar 22, 2026	—Unverified
ViCLSR: A Supervised Contrastive Learning Framework with Natural Language Inference for Natural Language Understanding Tasks	Mar 22, 2026	—Unverified
Interpreting the Synchronization Gap: The Hidden Mechanism Inside Diffusion Transformers	Mar 22, 2026	—Unverified
Can we automatize scientific discovery in the cognitive sciences?	Mar 22, 2026	—Unverified
Behavioural feasible set: Value alignment constraints on AI decision support	Mar 22, 2026	—Unverified
Text-Image Conditioned 3D Generation	Mar 22, 2026	—Unverified
Direct Interval Propagation Methods using Neural-Network Surrogates for Uncertainty Quantification in Physical Systems Surrogate Model	Mar 22, 2026	—Unverified
FluidWorld: Reaction-Diffusion Dynamics as a Predictive Substrate for World Models	Mar 22, 2026	—Unverified
HELIX: Scaling Raw Audio Understanding with Hybrid Mamba-Attention Beyond the Quadratic Limit	Mar 22, 2026	—Unverified
Stream separation improves Bregman conditioning in transformers	Mar 22, 2026	—Unverified
KHMP: Frequency-Domain Kalman Refinement for High-Fidelity Human Motion Prediction	Mar 22, 2026	—Unverified
COINBench: Moving Beyond Individual Perspectives to Collective Intent Understanding	Mar 22, 2026	—Unverified
FinRL-X: An AI-Native Modular Infrastructure for Quantitative Trading	Mar 22, 2026	—Unverified
Taming Sampling Perturbations with Variance Expansion Loss for Latent Diffusion Models	Mar 22, 2026	—Unverified
CVT-Bench: Counterfactual Viewpoint Transformations Reveal Unstable Spatial Representations in Multimodal LLMs	Mar 22, 2026	—Unverified
MS-CustomNet: Controllable Multi-Subject Customization with Hierarchical Relational Semantics	Mar 22, 2026	—Unverified
Incentivizing Generative Zero-Shot Learning via Outcome-Reward Reinforcement Learning with Visual Cues	Mar 22, 2026	—Unverified
Ontology-driven personalized information retrieval for XML documents	Mar 22, 2026	—Unverified
ORACLE: Optimizing Reasoning Abilities of Large Language Models via Constraint-Led Synthetic Data Elicitation	Mar 22, 2026	—Unverified
Time-adaptive functional Gaussian Process regression	Mar 22, 2026	—Unverified
NeSy-Edge: Neuro-Symbolic Trustworthy Self-Healing in the Computing Continuum	Mar 22, 2026	—Unverified
Learning from Label Proportions with Dual-proportion Constraints	Mar 22, 2026	—Unverified
Training-Free Instance-Aware 3D Scene Reconstruction and Diffusion-Based View Synthesis from Sparse Images	Mar 22, 2026	—Unverified
Model Evolution Under Zeroth-Order Optimization: A Neural Tangent Kernel Perspective	Mar 22, 2026	—Unverified
Pruned Adaptation Modules: A Simple yet Strong Baseline for Continual Foundation Models	Mar 22, 2026	—Unverified
Entropy Alone is Insufficient for Safe Selective Prediction in LLMs	Mar 22, 2026	—Unverified
Rethinking Plasticity in Deep Reinforcement Learning	Mar 22, 2026	—Unverified
Explainable Semantic Textual Similarity via Dissimilar Span Detection	Mar 22, 2026	—Unverified
Reward Sharpness-Aware Fine-Tuning for Diffusion Models	Mar 22, 2026	—Unverified
On the Role of Batch Size in Stochastic Conditional Gradient Methods	Mar 22, 2026	—Unverified
DSCSNet: A Dynamic Sparse Compression Sensing Network for Closely-Spaced Infrared Small Target Unmixing	Mar 22, 2026	—Unverified
Positional Segmentor-Guided Counterfactual Fine-Tuning for Spatially Localized Image Synthesis	Mar 22, 2026	—Unverified