The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11501–11550 of 661570 papers

Title	Date	Status
Two-Stage Photovoltaic Forecasting: Separating Weather Prediction from Plant-Characteristics	Mar 4, 2026	—Unverified
Unbiased Dynamic Pruning for Efficient Group-Based Policy Optimization	Mar 4, 2026	—Unverified
HBRB-BoW: A Retrained Bag-of-Words Vocabulary for ORB-SLAM via Hierarchical BRB-KMeans	Mar 4, 2026	—Unverified
LISTA-Transformer Model Based on Sparse Coding and Attention Mechanism and Its Application in Fault Diagnosis	Mar 4, 2026	—Unverified
Traces of Social Competence in Large Language Models	Mar 4, 2026	—Unverified
Learning Hip Exoskeleton Control Policy via Predictive Neuromusculoskeletal Simulation	Mar 4, 2026	—Unverified
CodeTaste: Can LLMs Generate Human-Level Code Refactorings?	Mar 4, 2026	—Unverified
Architectural Proprioception in State Space Models: Thermodynamic Training Induces Anticipatory Halt Detection	Mar 4, 2026	—Unverified
REDNET-ML: A Multi-Sensor Machine Learning Pipeline for Harmful Algal Bloom Risk Detection Along the Omani Coast	Mar 4, 2026	—Unverified
Noise-aware Client Selection for carbon-efficient Federated Learning via Gradient Norm Thresholding	Mar 4, 2026	—Unverified
Stable and Steerable Sparse Autoencoders with Weight Regularization	Mar 4, 2026	—Unverified
DeepScan: A Training-Free Framework for Visually Grounded Reasoning in Large Vision-Language Models	Mar 4, 2026	—Unverified
From Threat Intelligence to Firewall Rules: Semantic Relations in Hybrid AI Agent and Expert System Architectures	Mar 4, 2026	—Unverified
Generative Recommendation for Large-Scale Advertising	Mar 4, 2026	—Unverified
Hierarchical Inference and Closure Learning via Adaptive Surrogates for ODEs and PDEs	Mar 4, 2026	—Unverified
Beyond the Prompt: An Empirical Study of Cursor Rules	Mar 4, 2026	—Unverified
An Adaptive KKT-Based Indicator for Convergence Assessment in Multi-Objective Optimization	Mar 4, 2026	—Unverified
Order Is Not Layout: Order-to-Space Bias in Image Generation	Mar 4, 2026	—Unverified
To Think or Not To Think, That is The Question for Large Reasoning Models in Theory of Mind Tasks	Mar 4, 2026	—Unverified
Mozi: Governed Autonomy for Drug Discovery LLM Agents	Mar 4, 2026	—Unverified
MIND: Unified Inquiry and Diagnosis RL with Criteria Grounded Clinical Supports for Psychiatric Consultation	Mar 4, 2026	—Unverified
REVISION:Reflective Intent Mining and Online Reasoning Auxiliary for E-commerce Visual Search System Optimization	Mar 4, 2026	—Unverified
SHE: Stepwise Hybrid Examination Reinforcement Learning Framework for E-commerce Search Relevance	Mar 4, 2026	—Unverified
When Silence Is Golden: Can LLMs Learn to Abstain in Temporal QA and Beyond?	Mar 4, 2026	—Unverified
Empirical Evaluation of No Free Lunch Violations in Permutation-Based Optimization	Mar 4, 2026	—Unverified
Weakly Supervised Patch Annotation for Improved Screening of Diabetic Retinopathy	Mar 4, 2026	—Unverified
CLIP-Guided Multi-Task Regression for Multi-View Plant Phenotyping	Mar 4, 2026	CodeCode Available
MultiWikiQA: A Reading Comprehension Benchmark in 300+ Languages	Mar 4, 2026	—Unverified
MuRAL: A Multi-Resident Ambient Sensor Dataset Annotated with Natural Language for Activities of Daily Living	Mar 4, 2026	—Unverified
A Systematic Analysis of Biases in Large Language Models	Mar 4, 2026	—Unverified
Improved MambdaBDA Framework for Robust Building Damage Assessment Across Disaster Domains	Mar 4, 2026	—Unverified
Causal Circuit Tracing Reveals Distinct Computational Architectures in Single-Cell Foundation Models: Inhibitory Dominance, Biological Coherence, and Cross-Model Convergence	Mar 4, 2026	—Unverified
DAGE: Dual-Stream Architecture for Efficient and Fine-Grained Geometry Estimation	Mar 4, 2026	—Unverified
LEA: Label Enumeration Attack in Vertical Federated Learning	Mar 4, 2026	—Unverified
A Bi-Stage Framework for Automatic Development of Pixel-Based Planar Antenna Structures	Mar 4, 2026	—Unverified
Fairness Begins with State: Purifying Latent Preferences for Hierarchical Reinforcement Learning in Interactive Recommendation	Mar 4, 2026	—Unverified
Training-Free Reward-Guided Image Editing via Trajectory Optimal Control	Mar 4, 2026	—Unverified
AgentSelect: Benchmark for Narrative Query-to-Agent Recommendation	Mar 4, 2026	—Unverified
GarmentPile++: Affordance-Driven Cluttered Garments Retrieval with Vision-Language Reasoning	Mar 4, 2026	—Unverified
Image-based Prompt Injection: Hijacking Multimodal LLMs through Visually Embedded Adversarial Instructions	Mar 4, 2026	—Unverified
A Study on Building Efficient Zero-Shot Relation Extraction Models	Mar 4, 2026	—Unverified
Momentum Memory for Knowledge Distillation in Computational Pathology	Mar 4, 2026	—Unverified
FlowCorrect: Efficient Interactive Correction of Generative Flow Policies for Robotic Manipulation	Mar 4, 2026	—Unverified
ProSMA-UNet: Decoder Conditioning for Proximal-Sparse Skip Feature Selection	Mar 4, 2026	—Unverified
Polyp Segmentation Using Wavelet-Based Cross-Band Integration for Enhanced Boundary Representation	Mar 4, 2026	—Unverified
On the Learnability of Offline Model-Based Optimization: A Ranking Perspective	Mar 4, 2026	—Unverified
STEM Faculty Perspectives on Generative AI in Higher Education	Mar 4, 2026	—Unverified
A Multi-Dimensional Quality Scoring Framework for Decentralized LLM Inference with Proof of Quality	Mar 4, 2026	—Unverified
Dynamic Adversarial Reinforcement Learning for Robust Multimodal Large Language Models	Mar 4, 2026	—Unverified
Extending Czech Aspect-Based Sentiment Analysis with Opinion Terms: Dataset and LLM Benchmarks	Mar 4, 2026	—Unverified