The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7751–7775 of 474278 papers

Title	Date	Status
Beyond Softmax: Dual-Branch Sigmoid Architecture for Accurate Class Activation Maps	Nov 5, 2025	CodeCode Available
Jailbreaking in the Haystack	Nov 5, 2025	—Unverified
Reinforcement Learning Foundations for Deep Research Systems: A Survey	Nov 5, 2025	—Unverified
Hulu-Med: A Transparent Generalist Model towards Holistic Medical Vision-Language Understanding	Nov 5, 2025	CodeCode Available
CLAX: Fast and Flexible Neural Click Models in JAX	Nov 5, 2025	CodeCode Available
DE3S: Dual-Enhanced Soft-Sparse-Shape Learning for Medical Early Time-Series Classification	Nov 5, 2025	CodeCode Available
Noise Injection: Improving Out-of-Distribution Generalization for Limited Size Datasets	Nov 5, 2025	CodeCode Available
Revisiting Multimodal Positional Encoding in Vision-Language Models	Nov 5, 2025	CodeCode Available
CoPRIS: Efficient and Stable Reinforcement Learning via Concurrency-Controlled Partial Rollout with Importance Sampling	Nov 5, 2025	CodeCode Available
Sketch-Augmented Features Improve Learning Long-Range Dependencies in Graph Neural Networks	Nov 5, 2025	CodeCode Available
TabDSR: Decompose, Sanitize, and Reason for Complex Numerical Reasoning in Tabular Data	Nov 5, 2025	—Unverified
Diffusion Language Models are Super Data Learners	Nov 5, 2025	—Unverified
Decentralized Aerial Manipulation of a Cable-Suspended Load using Multi-Agent Reinforcement Learning	Nov 5, 2025	—Unverified
Towards Fine-Grained Text-to-3D Quality Assessment: A Benchmark and A Two-Stage Rank-Learning Metric	Nov 5, 2025	—Unverified
Incorporating Quality of Life in Climate Adaptation Planning via Reinforcement Learning	Nov 5, 2025	CodeCode Available
UniAVGen: Unified Audio and Video Generation with Asymmetric Cross-Modal Interactions	Nov 5, 2025	—Unverified
SyMuPe: Affective and Controllable Symbolic Music Performance	Nov 5, 2025	—Unverified
A Survey on Collaborating Small and Large Language Models for Performance, Cost-effectiveness, Cloud-edge Privacy, and Trustworthiness	Nov 5, 2025	CodeCode Available
PhysicsEval: Inference-Time Techniques to Improve the Reasoning Proficiency of Large Language Models on Physics Problems	Nov 5, 2025	CodeCode Available
CoTox: Chain-of-Thought-Based Molecular Toxicity Reasoning and Prediction	Nov 5, 2025	CodeCode Available
FaStfact: Faster, Stronger Long-Form Factuality Evaluations in LLMs	Nov 5, 2025	CodeCode Available
Scalable Evaluation and Neural Models for Compositional Generalization	Nov 5, 2025	CodeCode Available
From Insight to Exploit: Leveraging LLM Collaboration for Adaptive Adversarial Text Generation	Nov 5, 2025	CodeCode Available
Cross-Modal Alignment via Variational Copula Modelling	Nov 5, 2025	CodeCode Available
Climate Adaptation with Reinforcement Learning: Economic vs. Quality of Life Adaptation Pathways	Nov 5, 2025	CodeCode Available