The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8451–8475 of 474278 papers

Title	Date	Status
Alibaba International E-commerce Product Search Competition DILAB Team Technical Report	Oct 21, 2025	CodeCode Available
NeuroAda: Activating Each Neuron's Potential for Parameter-Efficient Fine-Tuning	Oct 21, 2025	CodeCode Available
ProfBench: Multi-Domain Rubrics requiring Professional Knowledge to Answer and Judge	Oct 21, 2025	CodeCode Available
Tree of Agents: Improving Long-Context Capabilities of Large Language Models through Multi-Perspective Reasoning	Oct 21, 2025	CodeCode Available
LAMP-PRo: Label-aware Attention for Multi-label Prediction of DNA- and RNA-binding Proteins using Protein Language Models	Oct 21, 2025	CodeCode Available
WebSeer: Training Deeper Search Agents through Reinforcement Learning with Self-Reflection	Oct 21, 2025	CodeCode Available
MEET-Sepsis: Multi-Endogenous-View Enhanced Time-Series Representation Learning for Early Sepsis Prediction	Oct 21, 2025	CodeCode Available
Beyond Single Images: Retrieval Self-Augmented Unsupervised Camouflaged Object Detection	Oct 21, 2025	CodeCode Available
BlendCLIP: Bridging Synthetic and Real Domains for Zero-Shot 3D Object Classification with Multimodal Pretraining	Oct 21, 2025	CodeCode Available
A^2FM: An Adaptive Agent Foundation Model for Tool-Aware Hybrid Reasoning	Oct 21, 2025	—Unverified
Learning to Interpret Weight Differences in Language Models	Oct 21, 2025	—Unverified
ssToken: Self-modulated and Semantic-aware Token Selection for LLM Fine-tuning	Oct 21, 2025	—Unverified
Cross-Modal Scene Semantic Alignment for Image Complexity Assessment	Oct 21, 2025	CodeCode Available
Adamas: Hadamard Sparse Attention for Efficient Long-Context Inference	Oct 21, 2025	—Unverified
Program Synthesis via Test-Time Transduction	Oct 21, 2025	CodeCode Available
Distilling LLM Prior to Flow Model for Generalizable Agent's Imagination in Object Goal Navigation	Oct 21, 2025	CodeCode Available
IASC: Interactive Agentic System for ConLangs	Oct 21, 2025	CodeCode Available
Can Large Language Models Master Complex Card Games?	Oct 21, 2025	CodeCode Available
Towards Agentic Self-Learning LLMs in Search Environment	Oct 21, 2025	CodeCode Available
DeepSeek-OCR: Contexts Optical Compression	Oct 21, 2025	CodeCode Available
Proactive Reasoning-with-Retrieval Framework for Medical Multimodal Large Language Models	Oct 21, 2025	CodeCode Available
Ranking-based Preference Optimization for Diffusion Models from Implicit User Feedback	Oct 21, 2025	CodeCode Available
Towards Unsupervised Open-Set Graph Domain Adaptation via Dual Reprogramming	Oct 21, 2025	CodeCode Available
SpecExit: Accelerating Large Reasoning Model via Speculative Exit	Oct 21, 2025	CodeCode Available
FlexQuant: A Flexible and Efficient Dynamic Precision Switching Framework for LLM Quantization	Oct 21, 2025	CodeCode Available