The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8551–8575 of 474278 papers

Title	Date	Status
EMRRG: Efficient Fine-Tuning Pre-trained X-ray Mamba Networks for Radiology Report Generation	Oct 19, 2025	—Unverified
When To Solve, When To Verify: Compute-Optimal Problem Solving and Generative Verification for LLM Reasoning	Oct 19, 2025	CodeCode Available
ShiZhi: A Chinese Lightweight Large Language Model for Court View Generation	Oct 19, 2025	CodeCode Available
Connecting Domains and Contrasting Samples: A Ladder for Domain Generalization	Oct 19, 2025	CodeCode Available
Forgetting to Forget: Attention Sink as A Gateway for Backdooring LLM Unlearning	Oct 19, 2025	CodeCode Available
Region in Context: Text-condition Image editing with Human-like semantic reasoning	Oct 19, 2025	CodeCode Available
Efficient Large Language Model Inference with Neural Block Linearization	Oct 19, 2025	CodeCode Available
Black-box Optimization of LLM Outputs by Asking for Directions	Oct 19, 2025	CodeCode Available
Promptable Fire Segmentation: Unleashing SAM2's Potential for Real-Time Mobile Deployment with Strategic Bounding Box Guidance	Oct 18, 2025	CodeCode Available
MoReBench: Evaluating Procedural and Pluralistic Moral Reasoning in Language Models, More than Outcomes	Oct 18, 2025	—Unverified
Humanoid-inspired Causal Representation Learning for Domain Generalization	Oct 18, 2025	CodeCode Available
MIRAD - A comprehensive real-world robust anomaly detection dataset for Mass Individualization	Oct 18, 2025	CodeCode Available
SDAR: A Synergistic Diffusion-AutoRegression Paradigm for Scalable Sequence Generation	Oct 18, 2025	—Unverified
SHANKS: Simultaneous Hearing and Thinking for Spoken Language Models	Oct 18, 2025	—Unverified
What Questions Should Robots Be Able to Answer? A Dataset of User Questions for Explainable Robotics	Oct 18, 2025	—Unverified
MultiVerse: A Multi-Turn Conversation Benchmark for Evaluating Large Vision and Language Models	Oct 18, 2025	—Unverified
A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers	Oct 18, 2025	—Unverified
Beyond One World: Benchmarking Super Heros in Role-Playing Across Multiversal Contexts	Oct 18, 2025	—Unverified
JND-Guided Light-Weight Neural Pre-Filter for Perceptual Image Coding	Oct 18, 2025	CodeCode Available
Geometric-Mean Policy Optimization	Oct 18, 2025	CodeCode Available
Chain-in-Tree: Back to Sequential Reasoning in LLM Tree Search	Oct 18, 2025	CodeCode Available
VIPAMIN: Visual Prompt Initialization via Embedding Selection and Subspace Expansion	Oct 18, 2025	CodeCode Available
LightGlueStick: a Fast and Robust Glue for Joint Point-Line Matching	Oct 18, 2025	CodeCode Available
RefAtomNet++: Advancing Referring Atomic Video Action Recognition using Semantic Retrieval based Multi-Trajectory Mamba	Oct 18, 2025	CodeCode Available
VisionSelector: End-to-End Learnable Visual Token Compression for Efficient Multimodal LLMs	Oct 18, 2025	CodeCode Available