The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8926–8950 of 474278 papers

Title	Date	Status
Knowledge-Level Consistency Reinforcement Learning: Dual-Fact Alignment for Long-Form Factuality	Oct 11, 2025	—Unverified
MM-HELIX: Boosting Multimodal Long-Chain Reflective Reasoning with Holistic Platform and Adaptive Hybrid Policy Optimization	Oct 11, 2025	—Unverified
Pharmacist: Safety Alignment Data Curation for Large Language Models against Harmful Fine-tuning	Oct 11, 2025	CodeCode Available
BabyBabelLM: A Multilingual Benchmark of Developmentally Plausible Training Data	Oct 11, 2025	—Unverified
RLFR: Extending Reinforcement Learning for LLMs with Flow Environment	Oct 11, 2025	—Unverified
X-VLA: Soft-Prompted Transformer as Scalable Cross-Embodiment Vision-Language-Action Model	Oct 11, 2025	—Unverified
Native Hybrid Attention for Efficient Sequence Modeling	Oct 11, 2025	CodeCode Available
Skill-Targeted Adaptive Training	Oct 11, 2025	CodeCode Available
Translution: Unifying Self-attention and Convolution for Adaptive and Relative Modeling	Oct 11, 2025	CodeCode Available
Cooperative Pseudo Labeling for Unsupervised Federated Classification	Oct 11, 2025	CodeCode Available
ViConEx-Med: Visual Concept Explainability via Multi-Concept Token Transformer for Medical Image Analysis	Oct 11, 2025	CodeCode Available
INR-Bench: A Unified Benchmark for Implicit Neural Representations in Multi-Domain Regression and Reconstruction	Oct 11, 2025	CodeCode Available
SGM: A Statistical Godel Machine for Risk-Controlled Recursive Self-Modification	Oct 11, 2025	CodeCode Available
Complementary and Contrastive Learning for Audio-Visual Segmentation	Oct 11, 2025	CodeCode Available
EpiCache: Episodic KV Cache Management for Long Conversational Question Answering	Oct 11, 2025	CodeCode Available
ADEPT: Continual Pretraining via Adaptive Expansion and Dynamic Decoupled Tuning	Oct 11, 2025	CodeCode Available
PermLLM: Learnable Channel Permutation for N:M Sparse Large Language Models	Oct 11, 2025	CodeCode Available
Blind Video Super-Resolution based on Implicit Kernels	Oct 11, 2025	CodeCode Available
EEG-MedRAG: Enhancing EEG-based Clinical Decision-Making via Hierarchical Hypergraph Retrieval-Augmented Generation	Oct 11, 2025	CodeCode Available
A Linguistics-Aware LLM Watermarking via Syntactic Predictability	Oct 10, 2025	CodeCode Available
Informed Routing in LLMs: Smarter Token-Level Computation for Faster Inference	Oct 10, 2025	CodeCode Available
Stable Video Infinity: Infinite-Length Video Generation with Error Recycling	Oct 10, 2025	—Unverified
Multimodal Policy Internalization for Conversational Agents	Oct 10, 2025	—Unverified
Haystack Engineering: Context Engineering for Heterogeneous and Agentic Long-Context Evaluation	Oct 10, 2025	—Unverified
Entropy Regularizing Activation: Boosting Continuous Control, Large Language Models, and Image Classification with Activation as Entropy Constraints	Oct 10, 2025	—Unverified