The Open Verification Layer for ML Research

Community benchmark tracking and reproducibility verification. Built for researchers and autonomous research agents.

474,278 papers248,326 code links4,818 tasks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 19801–19850 of 474278 papers

Title	Date	Tasks	Status	Hype
Proving Test Set Contamination in Black Box Language Models	Oct 26, 2023	Language Modelling	CodeCode Available	1
You Only Need Two Detectors to Achieve Multi-Modal 3D Multi-Object Tracking	Apr 18, 2023	3D Multi-Object TrackingMulti-Object Tracking	CodeCode Available	1
Selective Fairness in Recommendation via Prompts	May 10, 2022	AttributeFairness	CodeCode Available	1
A Versatile Multi-Agent Reinforcement Learning Benchmark for Inventory Management	Jun 13, 2023	Autonomous DrivingManagement	CodeCode Available	1
ComStreamClust: a communicative multi-agent approach to text clustering in streaming data	Oct 11, 2020	ClusteringSemantic Similarity	CodeCode Available	1
A Multi-modal Garden Dataset and Hybrid 3D Dense Reconstruction Framework Based on Panoramic Stereo Images for a Trimming Robot	May 10, 2023	Task Planning	CodeCode Available	1
Singing Voice Synthesis Using Differentiable LPC and Glottal-Flow-Inspired Wavetables	Jun 29, 2023	Singing Voice Synthesis	CodeCode Available	1
An Autotuning-based Optimization Framework for Mixed-kernel SVM Classifications in Smart Pixel Datasets and Heterojunction Transistors	Jun 26, 2024		CodeCode Available	1
Generalized One-shot Domain Adaptation of Generative Adversarial Networks	Sep 8, 2022	Domain AdaptationGenerative Adversarial Network	CodeCode Available	1
Kungfupanda at SemEval-2020 Task 12: BERT-Based Multi-Task Learning for Offensive Language Detection	Apr 28, 2020	Abuse DetectionLanguage Modeling	CodeCode Available	1
Automated Clinical Coding: What, Why, and Where We Are?	Mar 21, 2022		CodeCode Available	1
Ensemble Knowledge Guided Sub-network Search and Fine-tuning for Filter Pruning	Mar 5, 2022	GPUKnowledge Distillation	CodeCode Available	1
Enhanced Short Text Modeling: Leveraging Large Language Models for Topic Refinement	Mar 26, 2024	Prompt EngineeringTopic Models	CodeCode Available	1
MAAT: Mamba Adaptive Anomaly Transformer with association discrepancy for time series	Feb 11, 2025	Anomaly DetectionAnomaly Localization	CodeCode Available	1
Cloning Outfits from Real-World Images to 3D Characters for Generalizable Person Re-Identification	Apr 6, 2022	Generalizable Person Re-identificationPerson Re-Identification	CodeCode Available	1
Patcher: Patch Transformers with Mixture of Experts for Precise Medical Image Segmentation	Jun 3, 2022	DecoderImage Segmentation	CodeCode Available	1
Super-CLEVR: A Virtual Benchmark to Diagnose Domain Robustness in Visual Reasoning	Dec 1, 2022	Domain GeneralizationQuestion Answering	CodeCode Available	1
Block Coordinate Descent for Sparse NMF	Jan 15, 2013	3D Object Classification	CodeCode Available	1
Noise-powered Multi-modal Knowledge Graph Representation Framework	Mar 11, 2024	Entity AlignmentKnowledge Graph Completion	CodeCode Available	1
Interpretable Generative Models through Post-hoc Concept Bottlenecks	Mar 25, 2025		CodeCode Available	1
MedMNIST-C: Comprehensive benchmark and improved classifier robustness by simulating realistic image corruptions	Jun 25, 2024	Data AugmentationDomain Generalization	CodeCode Available	1
Think Step by Step: Chain-of-Gesture Prompting for Error Detection in Robotic Surgical Videos	Jun 27, 2024	Temporal Information ExtractionVisual Reasoning	CodeCode Available	1
MUGEN: A Playground for Video-Audio-Text Multimodal Understanding and GENeration	Apr 17, 2022	NavigateRetrieval	CodeCode Available	1
Explainable Time Series Anomaly Detection using Masked Latent Generative Modeling	Nov 21, 2023	Anomaly DetectionTime Series	CodeCode Available	1
DeepVARwT: Deep Learning for a VAR Model with Trend	Sep 21, 2022	Deep LearningTime Series	CodeCode Available	1
Stripformer: Strip Transformer for Fast Image Deblurring	Apr 10, 2022	DeblurringImage Deblurring	CodeCode Available	1
EDA: Evolving and Distinct Anchors for Multimodal Motion Prediction	Dec 15, 2023	Autonomous Drivingmotion prediction	CodeCode Available	1
Quantum approximate optimization via learning-based adaptive optimization	Mar 27, 2023	Bayesian OptimizationCombinatorial Optimization	CodeCode Available	1
Benchmarking LLMs for Political Science: A United Nations Perspective	Feb 19, 2025	BenchmarkingDecision Making	CodeCode Available	1
Continual Learning in Medical Imaging: A Survey and Practical Analysis	May 22, 2024	Continual LearningSurvey	CodeCode Available	1
SPANet: Frequency-balancing Token Mixer using Spectral Pooling Aggregation Modulation	Aug 22, 2023		CodeCode Available	1
Are Deep Neural Networks SMARTer than Second Graders?	Dec 20, 2022	Language ModellingMeta-Learning	CodeCode Available	1
SAMCT: Segment Any CT Allowing Labor-Free Task-Indicator Prompts	Mar 20, 2024		CodeCode Available	1
Robust Point Cloud Registration Framework Based on Deep Graph Matching	Mar 7, 2021	graph constructionGraph Matching	CodeCode Available	1
Semi-MoreGAN: A New Semi-supervised Generative Adversarial Network for Mixture of Rain Removal	Apr 28, 2022	Depth EstimationDepth Prediction	CodeCode Available	1
On Robust Prefix-Tuning for Text Classification	Mar 19, 2022	ClassificationLanguage Modelling	CodeCode Available	1
Object-Centric Slot Diffusion	Mar 20, 2023	Image GenerationImage Segmentation	CodeCode Available	1
Unveiling Transformers with LEGO: a synthetic reasoning task	Jun 9, 2022	Learning to Execute	CodeCode Available	1
Lifelong Learning on Evolving Graphs Under the Constraints of Imbalanced Classes and New Classes	Dec 20, 2021	Graph AttentionGraph Learning	CodeCode Available	1
DSPNet: Dual-vision Scene Perception for Robust 3D Question Answering	Mar 5, 2025	3D Question Answering (3D-QA)Question Answering	CodeCode Available	1
SynthSeg: Segmentation of brain MRI scans of any contrast and resolution without retraining	Jul 20, 2021	Data AugmentationDomain Adaptation	CodeCode Available	1
A Graph-Based Modeling Framework for Tracing Hydrological Pollutant Transport in Surface Waters	Feb 10, 2023	Decision Making	CodeCode Available	1
Flow Network based Generative Models for Non-Iterative Diverse Candidate Generation	Jun 8, 2021		CodeCode Available	1
Efficient Wasserstein Natural Gradients for Reinforcement Learning	Oct 12, 2020	Policy Gradient Methodsreinforcement-learning	CodeCode Available	1
Automated Generation of Challenging Multiple-Choice Questions for Vision Language Model Evaluation	Jan 6, 2025	Language Model EvaluationLanguage Modeling	CodeCode Available	1
Approximating Two-Layer Feedforward Networks for Efficient Transformers	Oct 16, 2023		CodeCode Available	1
Group DETR: Fast DETR Training with Group-Wise One-to-Many Assignment	Jul 26, 2022	Data AugmentationDecoder	CodeCode Available	1
Federated Foundation Models on Heterogeneous Time Series	Dec 12, 2024	Anomaly DetectionFederated Learning	CodeCode Available	1
Parallel AutoRegressive Models for Multi-Agent Combinatorial Optimization	Sep 5, 2024	Combinatorial OptimizationComputational Efficiency	CodeCode Available	1
Towards the Practical Utility of Federated Learning in the Medical Domain	Jul 7, 2022	Federated Learning	CodeCode Available	1