The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8526–8550 of 474278 papers

Title	Date	Status
Select-Then-Decompose: From Empirical Analysis to Adaptive Selection Strategy for Task Decomposition in Large Language Models	Oct 20, 2025	CodeCode Available
SimBA: Simplifying Benchmark Analysis Using Performance Matrices Alone	Oct 20, 2025	CodeCode Available
Language Confusion Gate: Language-Aware Decoding Through Model Self-Distillation	Oct 20, 2025	CodeCode Available
VisiPruner: Decoding Discontinuous Cross-Modal Dynamics for Efficient Multimodal LLMs	Oct 20, 2025	CodeCode Available
λ-Orthogonality Regularization for Compatible Representation Learning	Oct 20, 2025	CodeCode Available
ScreenCoder: Advancing Visual-to-Code Generation for Front-End Automation via Modular Multimodal Agents	Oct 20, 2025	CodeCode Available
FlowDet: Overcoming Perspective and Scale Challenges in Real-Time End-to-End Traffic Detection	Oct 20, 2025	CodeCode Available
TimeEmb: A Lightweight Static-Dynamic Disentanglement Framework for Time Series Forecasting	Oct 20, 2025	CodeCode Available
Synthetic Series-Symbol Data Generation for Time Series Foundation Models	Oct 20, 2025	CodeCode Available
Shape-aware Inertial Poser: Motion Tracking for Humans with Diverse Shapes Using Sparse Inertial Sensors	Oct 20, 2025	CodeCode Available
Benchmarking Out-of-Distribution Detection for Plankton Recognition: A Systematic Evaluation of Advanced Methods in Marine Ecological Monitoring	Oct 20, 2025	CodeCode Available
Rethinking Nighttime Image Deraining via Learnable Color Space Transformation	Oct 20, 2025	CodeCode Available
An Empirical Study of Lagrangian Methods in Safe Reinforcement Learning	Oct 20, 2025	CodeCode Available
CEPerFed: Communication-Efficient Personalized Federated Learning for Multi-Pulse MRI Classification	Oct 20, 2025	CodeCode Available
Multilingual Text-to-Image Person Retrieval via Bidirectional Relation Reasoning and Aligning	Oct 20, 2025	CodeCode Available
AcademicEval: Live Long-Context LLM Benchmark	Oct 20, 2025	CodeCode Available
DETree: DEtecting Human-AI Collaborative Texts via Tree-Structured Hierarchical Representation Learning	Oct 20, 2025	CodeCode Available
Mismatch reconstruction theory for unknown measurement matrix in imaging through multimode fiber bending	Oct 19, 2025	CodeCode Available
Class-N-Diff: Classification-Induced Diffusion Model Can Make Fair Skin Cancer Diagnosis	Oct 19, 2025	CodeCode Available
RL-PLUS: Countering Capability Boundary Collapse of LLMs in Reinforcement Learning with Hybrid-policy Optimization	Oct 19, 2025	—Unverified
Q: Provably Optimal Distributional RL for LLM Post-Training	Oct 19, 2025	CodeCode Available
Agentic Design of Compositional Machines	Oct 19, 2025	—Unverified
DeepAnalyze: Agentic Large Language Models for Autonomous Data Science	Oct 19, 2025	—Unverified
Investigating Safety Vulnerabilities of Large Audio-Language Models Under Speaker Emotional Variations	Oct 19, 2025	—Unverified
A Controllable Examination for Long-Context Language Models	Oct 19, 2025	—Unverified