The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 18801–18850 of 474278 papers

Title	Date	Tasks	Status	Hype
Alternate Preference Optimization for Unlearning Factual Knowledge in Large Language Models	Sep 20, 2024	Machine Unlearning	CodeCode Available	1
3D Detection and Characterisation of ALMA Sources through Deep Learning	Nov 21, 2022	Deep LearningDenoising	CodeCode Available	1
Mutual Distillation Learning For Person Re-Identification	Jan 12, 2024	Hard AttentionPerson Re-Identification	CodeCode Available	1
ChatGPT in the Age of Generative AI and Large Language Models: A Concise Survey	Jul 9, 2023	Language ModellingLarge Language Model	CodeCode Available	1
Introducing the VoicePrivacy Initiative	May 4, 2020	Benchmarking	CodeCode Available	1
Self-supervised Monocular Underwater Depth Recovery, Image Restoration, and a Real-sea Video Dataset	Jan 1, 2023	Depth EstimationDisentanglement	CodeCode Available	1
Referring Multi-Object Tracking	Mar 6, 2023	Multi-Object TrackingObject	CodeCode Available	1
Eye-gaze Guided Multi-modal Alignment for Medical Representation Learning	Mar 19, 2024	Diagnosticimage-classification	CodeCode Available	1
Next Generation Loss Function for Image Classification	Apr 19, 2024	Classificationimage-classification	CodeCode Available	1
Steward: Natural Language Web Automation	Sep 23, 2024		CodeCode Available	1
CLIP-Adapter: Better Vision-Language Models with Feature Adapters	Oct 9, 2021	Prompt EngineeringRepresentation Learning	CodeCode Available	1
3D Focusing-and-Matching Network for Multi-Instance Point Cloud Registration	Nov 12, 2024	ObjectPoint Cloud Registration	CodeCode Available	1
Invariant Collaborative Filtering to Popularity Distribution Shift	Feb 10, 2023	Collaborative FilteringRepresentation Learning	CodeCode Available	1
Evaluating Unsupervised Text Classification: Zero-shot and Similarity-based Approaches	Nov 29, 2022	Classificationtext-classification	CodeCode Available	1
Neuro-Symbolic Integration Brings Causal and Reliable Reasoning Proofs	Nov 16, 2023	Arithmetic ReasoningGSM8K	CodeCode Available	1
Single-Domain Generalized Object Detection in Urban Scene via Cyclic-Disentangled Self-Distillation	Jan 1, 2022	Objectobject-detection	CodeCode Available	1
E2ENet: Dynamic Sparse Feature Fusion for Accurate and Efficient 3D Medical Image Segmentation	Dec 7, 2023	Brain Tumor SegmentationImage Segmentation	CodeCode Available	1
Higher-order Coreference Resolution with Coarse-to-fine Inference	Apr 15, 2018	Coreference Resolution	CodeCode Available	1
Robust 6DoF Pose Estimation Against Depth Noise and a Comprehensive Evaluation on a Mobile Dataset	Sep 24, 2023	3D Object Detection3D Object Tracking	CodeCode Available	1
Graph Matching with Bi-level Noisy Correspondence	Dec 8, 2022	Contrastive LearningGraph Learning	CodeCode Available	1
DagSim: Combining DAG-based model structure with unconstrained data types and relations for flexible, transparent, and modularized data simulation	May 6, 2022	BIG-bench Machine LearningCausal Inference	CodeCode Available	1
Prototype-Driven and Multi-Expert Integrated Multi-Modal MR Brain Tumor Image Segmentation	Jul 22, 2023	Brain Tumor SegmentationImage Segmentation	CodeCode Available	1
Using Mechanistic Interpretability to Craft Adversarial Attacks against Large Language Models	Mar 8, 2025		CodeCode Available	1
Tisane: Authoring Statistical Models via Formal Reasoning from Conceptual and Data Relationships	Jan 7, 2022	valid	CodeCode Available	1
MAD-AD: Masked Diffusion for Unsupervised Brain Anomaly Detection	Feb 24, 2025	AnatomyAnomaly Detection	CodeCode Available	1
Tackling Long-Tailed Category Distribution Under Domain Shifts	Jul 20, 2022	Domain GeneralizationMeta-Learning	CodeCode Available	1
CalibNet: Dual-branch Cross-modal Calibration for RGB-D Salient Instance Segmentation	Jul 16, 2023	Instance SegmentationSemantic Segmentation	CodeCode Available	1
Weakly Supervised Object Detection in Chest X-Rays with Differentiable ROI Proposal Networks and Soft ROI Pooling	Feb 19, 2024	image-classificationImage Classification	CodeCode Available	1
MetaMetrics-MT: Tuning Meta-Metrics for Machine Translation via Human Preference Calibration	Nov 1, 2024	Bayesian OptimizationGaussian Processes	CodeCode Available	1
ClusterKV: Manipulating LLM KV Cache in Semantic Space for Recallable Compression	Dec 4, 2024	2kLogical Reasoning	CodeCode Available	1
Data-Efficient Contrastive Language-Image Pretraining: Prioritizing Data Quality over Quantity	Mar 18, 2024	Zero-shot Generalization	CodeCode Available	1
Learning Accurate Dense Correspondences and When to Trust Them	Jan 5, 2021	3D ReconstructionDense Pixel Correspondence Estimation	CodeCode Available	1
Patent Image Retrieval Using Cross-entropy-based Metric Learning	Feb 20, 2023	Image RetrievalMetric Learning	CodeCode Available	1
LinkQ: An LLM-Assisted Visual Interface for Knowledge Graph Question-Answering	Jun 7, 2024	Graph Question AnsweringLanguage Modeling	CodeCode Available	1
fastMRI: An Open Dataset and Benchmarks for Accelerated MRI	Nov 21, 2018	BIG-bench Machine LearningImage Reconstruction	CodeCode Available	1
CausPref: Causal Preference Learning for Out-of-Distribution Recommendation	Feb 8, 2022	Recommendation Systems	CodeCode Available	1
Fine-Grained Semantically Aligned Vision-Language Pre-Training	Aug 4, 2022	cross-modal alignmentobject-detection	CodeCode Available	1
Diverse and Aligned Audio-to-Video Generation via Text-to-Video Model Adaptation	Sep 28, 2023	Text-to-Video GenerationVideo Generation	CodeCode Available	1
TSGBench: Time Series Generation Benchmark	Sep 7, 2023	Anomaly DetectionData Augmentation	CodeCode Available	1
Learnable Polyphase Sampling for Shift Invariant and Equivariant Convolutional Networks	Oct 14, 2022	image-classificationImage Classification	CodeCode Available	1
Sampling-free Inference for Ab-Initio Potential Energy Surface Networks	May 30, 2022	Inductive BiasNumerical Integration	CodeCode Available	1
Choices, Risks, and Reward Reports: Charting Public Policy for Reinforcement Learning Systems	Feb 11, 2022	Recommendation Systemsreinforcement-learning	CodeCode Available	1
Can Pre-trained Language Models Interpret Similes as Smart as Human?	Mar 16, 2022	Sentiment AnalysisSentiment Classification	CodeCode Available	1
Blind Motion Deblurring with Pixel-Wise Kernel Estimation via Kernel Prediction Networks	Aug 5, 2023	Deblurring	CodeCode Available	1
GPTutor: a ChatGPT-powered programming tool for code explanation	May 3, 2023	Text Generation	CodeCode Available	1
PromptCoT: Synthesizing Olympiad-level Problems for Mathematical Reasoning in Large Language Models	Mar 4, 2025	GSM8KMath	CodeCode Available	1
Addressing Maximization Bias in Reinforcement Learning with Two-Sample Testing	Jan 20, 2022	Q-Learningreinforcement-learning	CodeCode Available	1
A Multi-Task Semantic Decomposition Framework with Task-specific Pre-training for Few-Shot NER	Aug 28, 2023	Contrastive Learningfew-shot-ner	CodeCode Available	1
Exploring the Individuality and Collectivity of Intents behind Interactions for Graph Collaborative Filtering	May 15, 2024	Collaborative FilteringGraph Generation	CodeCode Available	1
HumanGif: Single-View Human Diffusion with Generative Prior	Feb 17, 2025	3D Human ReconstructionNeRF	CodeCode Available	1