The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3076–3100 of 661570 papers

Title	Date	Tasks	Status	Hype
Diffusion Language Models Are Versatile Protein Learners	Feb 28, 2024	Language ModelingLanguage Modelling	CodeCode Available	3
CAMixerSR: Only Details Need More "Attention"	Feb 29, 2024	2k8k	CodeCode Available	3
CLLMs: Consistency Large Language Models	Feb 28, 2024		CodeCode Available	3
SynCode: LLM Generation with Grammar Augmentation	Mar 3, 2024	Code Generationvalid	CodeCode Available	3
Controllable Text Generation for Large Language Models: A Survey	Aug 22, 2024	AttributePrompt Engineering	CodeCode Available	3
RealNet: A Feature Selection Network with Realistic Synthetic Anomaly for Anomaly Detection	Mar 9, 2024	Anomaly Detectionfeature selection	CodeCode Available	3
Generalizing Denoising to Non-Equilibrium Structures Improves Equivariant Force Fields	Mar 14, 2024	Denoising	CodeCode Available	3
Retrieval Augmented Generation and Understanding in Vision: A Survey and New Outlook	Mar 23, 2025	3D GenerationMedical Report Generation	CodeCode Available	3
Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images	Mar 19, 2024	Anomaly ClassificationAnomaly Detection	CodeCode Available	3
AlphaFin: Benchmarking Financial Analysis with Retrieval-Augmented Stock-Chain Framework	Mar 19, 2024	BenchmarkingFinancial Analysis	CodeCode Available	3
Rotary Position Embedding for Vision Transformer	Mar 20, 2024	Position	CodeCode Available	3
AdaIR: Adaptive All-in-One Image Restoration via Frequency Mining and Modulation	Mar 21, 2024	AllBlind All-in-One Image Restoration	CodeCode Available	3
The Elements of Differentiable Programming	Mar 21, 2024		CodeCode Available	3
Advancing LLM Reasoning Generalists with Preference Trees	Apr 2, 2024	BenchmarkingCode Generation	CodeCode Available	3
Annif at SemEval-2025 Task 5: Traditional XMTC augmented by LLMs	Apr 28, 2025	Synthetic Data Generation	CodeCode Available	3
OGBench: Benchmarking Offline Goal-Conditioned RL	Oct 26, 2024	Benchmarkingreinforcement-learning	CodeCode Available	3
HPNet: Dynamic Trajectory Forecasting with Historical Prediction Attention	Apr 9, 2024	Autonomous DrivingPrediction	CodeCode Available	3
Graph Chain-of-Thought: Augmenting Large Language Models by Reasoning on Graphs	Apr 10, 2024		CodeCode Available	3
NeuroNCAP: Photorealistic Closed-loop Safety Testing for Autonomous Driving	Apr 11, 2024	Autonomous DrivingNeRF	CodeCode Available	3
Benchmarking Multimodal Retrieval Augmented Generation with Dynamic VQA Dataset and Self-adaptive Planning Agent	Nov 5, 2024	BenchmarkingHallucination	CodeCode Available	3
VRAG-RL: Empower Vision-Perception-Based RAG for Visually Rich Information Understanding via Iterative Reasoning with Reinforcement Learning	May 28, 2025	RAG	CodeCode Available	3
CharacterFactory: Sampling Consistent Characters with GANs for Diffusion Models	Apr 24, 2024	Consistent Character GenerationWord Embeddings	CodeCode Available	3
ModernTCN: A Modern Pure Convolution Structure for General Time Series Analysis	Jan 16, 2024	Time SeriesTime Series Analysis	CodeCode Available	3
Efficient Multimodal Large Language Models: A Survey	May 17, 2024	Edge-computingQuestion Answering	CodeCode Available	3
CV-VAE: A Compatible Video VAE for Latent Generative Video Models	May 30, 2024	Quantization	CodeCode Available	3