The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10576–10600 of 177340 papers

Title	Date	Tasks	Status	Hype	Score
PEDANTS: Cheap but Effective and Interpretable Answer Equivalence	Feb 17, 2024	BenchmarkingForm	CodeCode Available	2	5
SchNetPack 2.0: A neural network toolbox for atomistic machine learning	Dec 11, 2022		CodeCode Available	2	5
Closed-Form Factorization of Latent Semantics in GANs	Jul 13, 2020	AttributeForm	CodeCode Available	2	5
Character-Adapter: Prompt-Guided Region Control for High-Fidelity Character Customization	Jun 24, 2024	Consistent Character GenerationImage Generation	CodeCode Available	2	5
OptiChat: Bridging Optimization Models and Practitioners with Large Language Models	Jan 14, 2025	Code Generationcounterfactual	CodeCode Available	2	5
CodeAttack: Revealing Safety Generalization Challenges of Large Language Models via Code Completion	Mar 12, 2024	Code CompletionSafety Alignment	CodeCode Available	2	5
VL-ICL Bench: The Devil in the Details of Multimodal In-Context Learning	Mar 19, 2024	BenchmarkingImage Captioning	CodeCode Available	2	5
ESM All-Atom: Multi-scale Protein Language Model for Unified Molecular Modeling	Mar 5, 2024	AllLanguage Modeling	CodeCode Available	2	5
Multi-Scale VMamba: Hierarchy in Hierarchy Visual State Space Model	May 23, 2024	MambaState Space Models	CodeCode Available	2	5
TableRAG: A Retrieval Augmented Generation Framework for Heterogeneous Document Reasoning	Jun 12, 2025	Answer GenerationChunking	CodeCode Available	2	5
Controllable 3D Outdoor Scene Generation via Scene Graphs	Mar 10, 2025	Autonomous DrivingScene Generation	CodeCode Available	2	5
DDSP: Differentiable Digital Signal Processing	Jan 14, 2020	Audio GenerationAudio Synthesis	CodeCode Available	2	5
Coswara: A website application enabling COVID-19 screening by analysing respiratory sound samples and health symptoms	Jun 9, 2022	COVID-19 Diagnosis	CodeCode Available	2	5
Diffusion Explainer: Visual Explanation for Text-to-image Stable Diffusion	May 4, 2023	Image Generation	CodeCode Available	2	5
RetroGFN: Diverse and Feasible Retrosynthesis using GFlowNets	Jun 26, 2024	RetrosynthesisSingle-step retrosynthesis	CodeCode Available	2	5
Reevaluating Adversarial Examples in Natural Language	Apr 25, 2020	Sentence	CodeCode Available	2	5
CTR-Driven Advertising Image Generation with Multimodal Large Language Models	Feb 5, 2025	Image GenerationReinforcement Learning (RL)	CodeCode Available	2	5
Learning Few-Step Diffusion Models by Trajectory Distribution Matching	Mar 9, 2025	Image GenerationText to Image Generation	CodeCode Available	2	5
T2S: High-resolution Time Series Generation with Text-to-Series Diffusion Models	May 5, 2025	Time SeriesTime Series Generation	CodeCode Available	2	5
RM-R1: Reward Modeling as Reasoning	May 5, 2025	MathReinforcement Learning (RL)	CodeCode Available	2	5
OBELiX: A Curated Dataset of Crystal Structures and Experimentally Measured Ionic Conductivities for Lithium Solid-State Electrolytes	Feb 20, 2025		CodeCode Available	2	5
pyKT: A Python Library to Benchmark Deep Learning based Knowledge Tracing Models	Jun 23, 2022	Knowledge Tracingvalid	CodeCode Available	2	5
Lemur: Harmonizing Natural Language and Code for Language Agents	Oct 10, 2023		CodeCode Available	2	5
FewJoint: A Few-shot Learning Benchmark for Joint Language Understanding	Sep 17, 2020	Few-Shot Learning	CodeCode Available	2	5
ForesightNav: Learning Scene Imagination for Efficient Exploration	Apr 22, 2025	Efficient ExplorationNavigate	CodeCode Available	2	5