The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

661,570 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6051–6100 of 177340 papers

Title	Date	Tasks	Status	Hype	Score
Lenia - Biology of Artificial Life	Dec 13, 2018	Artificial LifeDiversity	CodeCode Available	2	5
WildTeaming at Scale: From In-the-Wild Jailbreaks to (Adversarially) Safer Language Models	Jun 26, 2024	ChatbotRed Teaming	CodeCode Available	2	5
SGPT: GPT Sentence Embeddings for Semantic Search	Feb 17, 2022	Argument RetrievalBiomedical Information Retrieval	CodeCode Available	2	5
AXIAL: Attention-based eXplainability for Interpretable Alzheimer's Localized Diagnosis using 2D CNNs on 3D MRI brain scans	Jul 2, 2024	3D ClassificationAlzheimer's Disease Detection	CodeCode Available	2	5
Model Uncertainty in Evolutionary Optimization and Bayesian Optimization: A Comparative Analysis	Mar 21, 2024	Bayesian Optimization	CodeCode Available	2	5
AGILE: A Novel Reinforcement Learning Framework of LLM Agents	May 23, 2024	Question Answeringreinforcement-learning	CodeCode Available	2	5
Learning Local Equivariant Representations for Large-Scale Atomistic Dynamics	Apr 11, 2022	Atomic Forces	CodeCode Available	2	5
How Can Time Series Analysis Benefit From Multiple Modalities? A Survey and Outlook	Mar 14, 2025	Time SeriesTime Series Analysis	CodeCode Available	2	5
Bayesian Neural Networks for One-to-Many Mapping in Image Enhancement	Jan 24, 2025	Image Enhancement	CodeCode Available	2	5
BK-SDM: A Lightweight, Fast, and Cheap Version of Stable Diffusion	May 25, 2023	DreamBooth Personalized GenerationImage-to-Image Translation	CodeCode Available	2	5
Alphazero-like Tree-Search can Guide Large Language Model Decoding and Training	Sep 29, 2023	Decision MakingLanguage Modeling	CodeCode Available	2	5
MicroFlow: An Efficient Rust-Based Inference Engine for TinyML	Sep 28, 2024	Human Detection	CodeCode Available	2	5
Advancing Time Series Classification with Multimodal Language Modeling	Mar 19, 2024	ClassificationLanguage Modeling	CodeCode Available	2	5
Trajectory balance: Improved credit assignment in GFlowNets	Jan 31, 2022	Diversity	CodeCode Available	2	5
From Instance Training to Instruction Learning: Task Adapters Generation from Instructions	Jun 18, 2024	Knowledge Distillation	CodeCode Available	2	5
RoleLLM: Benchmarking, Eliciting, and Enhancing Role-Playing Abilities of Large Language Models	Oct 1, 2023	Benchmarking	CodeCode Available	2	5
φ-Decoding: Adaptive Foresight Sampling for Balanced Inference-Time Exploration and Exploitation	Mar 17, 2025		CodeCode Available	2	5
Efficient Mixed Transformer for Single Image Super-Resolution	May 19, 2023	Image Super-ResolutionSuper-Resolution	CodeCode Available	2	5
CoMoGaussian: Continuous Motion-Aware Gaussian Splatting from Motion-Blurred Images	Mar 7, 2025	3DGS3D Scene Reconstruction	CodeCode Available	2	5
PAL: Proxy-Guided Black-Box Attack on Large Language Models	Feb 15, 2024		CodeCode Available	2	5
PyReason: Software for Open World Temporal Logic	Feb 27, 2023	Knowledge Graphs	CodeCode Available	2	5
mDPO: Conditional Preference Optimization for Multimodal Large Language Models	Jun 17, 2024	HallucinationLanguage Modeling	CodeCode Available	2	5
In-Context Matting	Mar 23, 2024	Image Matting	CodeCode Available	2	5
NTIRE 2025 Challenge on Image Super-Resolution (4): Methods and Results	Apr 20, 2025	Image Super-ResolutionSuper-Resolution	CodeCode Available	2	5
MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models	Jun 23, 2023	BenchmarkingLanguage Modeling	CodeCode Available	2	5
COVINS-G: A Generic Back-end for Collaborative Visual-Inertial SLAM	Jan 17, 2023	Pose Estimation	CodeCode Available	2	5
Accelerating Transformer Pre-training with 2:4 Sparsity	Apr 2, 2024	GPU	CodeCode Available	2	5
Humanizing Machine-Generated Content: Evading AI-Text Detection through Adversarial Attack	Apr 2, 2024	Adversarial AttackText Detection	CodeCode Available	2	5
RaNDT SLAM: Radar SLAM Based on Intensity-Augmented Normal Distributions Transform	Aug 21, 2024	Indoor LocalizationSimultaneous Localization and Mapping	CodeCode Available	2	5
Event Stream-based Visual Object Tracking: HDETrack V2 and A High-Definition Benchmark	Feb 8, 2025	Knowledge DistillationObject Tracking	CodeCode Available	2	5
RealCompo: Balancing Realism and Compositionality Improves Text-to-Image Diffusion Models	Feb 20, 2024	DenoisingImage Generation	CodeCode Available	2	5
EPTQ: Enhanced Post-Training Quantization via Hessian-guided Network-wise Optimization	Sep 20, 2023	Knowledge Distillationobject-detection	CodeCode Available	2	5
DualDn: Dual-domain Denoising via Differentiable ISP	Sep 27, 2024	DenoisingImage Denoising	CodeCode Available	2	5
An Empirical Study on Hyperparameter Optimization for Fine-Tuning Pre-trained Language Models	Jun 17, 2021	Hyperparameter Optimization	CodeCode Available	2	5
MedUniSeg: 2D and 3D Medical Image Segmentation via a Prompt-driven Universal Model	Oct 8, 2024	Image SegmentationMedical Image Segmentation	CodeCode Available	2	5
EMR-Merging: Tuning-Free High-Performance Model Merging	May 23, 2024	Image ClassificationImage Retrieval	CodeCode Available	2	5
Flow Annealed Importance Sampling Bootstrap	Aug 3, 2022		CodeCode Available	2	5
Learn to Explain: Multimodal Reasoning via Thought Chains for Science Question Answering	Sep 20, 2022	Multimodal Deep LearningMultimodal Reasoning	CodeCode Available	2	5
Online-LoRA: Task-free Online Continual Learning via Low Rank Adaptation	Nov 8, 2024	Continual Learning	CodeCode Available	2	5
Multi-Robot Motion Planning with Diffusion Models	Oct 4, 2024	Motion Planning	CodeCode Available	2	5
Random-Access Infinite Context Length for Transformers	Sep 21, 2023		CodeCode Available	2	5
Unsupervised Real-Time Hallucination Detection based on the Internal States of Large Language Models	Mar 11, 2024	Hallucination	CodeCode Available	2	5
GlueStick: Robust Image Matching by Sticking Points and Lines Together	Apr 4, 2023	Graph Neural NetworkPose Estimation	CodeCode Available	2	5
A Unified Image-Dense Annotation Generation Model for Underwater Scenes	Mar 27, 2025	Depth EstimationPrediction	CodeCode Available	2	5
Attacking Vision-Language Computer Agents via Pop-ups	Nov 4, 2024		CodeCode Available	2	5
Comparing Retrieval-Augmentation and Parameter-Efficient Fine-Tuning for Privacy-Preserving Personalization of Large Language Models	Sep 14, 2024	parameter-efficient fine-tuningPrivacy Preserving	CodeCode Available	2	5
OmniSearchSage: Multi-Task Multi-Entity Embeddings for Pinterest Search	Apr 25, 2024	Entity EmbeddingsImage Captioning	CodeCode Available	2	5
ProGen2: Exploring the Boundaries of Protein Language Models	Jun 27, 2022	Protein Design	CodeCode Available	2	5
From Pixels to Graphs: Open-Vocabulary Scene Graph Generation with Vision-Language Models	Apr 1, 2024	Graph GenerationImage to text	CodeCode Available	2	5
DiffTF++: 3D-aware Diffusion Transformer for Large-Vocabulary 3D Generation	May 13, 2024	3D GenerationDecoder	CodeCode Available	2	5