Data Poisoning

Data Poisoning is an adversarial attack that tries to manipulate the training dataset in order to control the prediction behavior of a trained model such that the model will label malicious examples into a desired classes (e.g., labeling spam e-mails as safe).

Source: Explaining Vulnerabilities to Adversarial Machine Learning through Visual Analytics

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 492 papers

Title	Date	Tasks	Status	Hype
A Survey of Attacks on Large Vision-Language Models: Resources, Advances, and Future Trends	Jul 10, 2024	Data Poisoning	CodeCode Available	4
Safety at Scale: A Comprehensive Survey of Large Model Safety	Feb 2, 2025	Autonomous DrivingData Poisoning	CodeCode Available	3
BackdoorLLM: A Comprehensive Benchmark for Backdoor Attacks and Defenses on Large Language Models	Aug 23, 2024	Data Poisoningtext-classification	CodeCode Available	3
Data Poisoning in LLMs: Jailbreak-Tuning and Scaling Laws	Aug 6, 2024	Data Poisoning	CodeCode Available	3
Quantifying the robustness of deep multispectral segmentation models against natural perturbations and data poisoning	May 18, 2023	Adversarial RobustnessData Poisoning	CodeCode Available	3
SoK: Benchmarking Poisoning Attacks and Defenses in Federated Learning	Feb 6, 2025	BenchmarkingData Poisoning	CodeCode Available	2
Watch Out for Your Agents! Investigating Backdoor Threats to LLM-Based Agents	Feb 17, 2024	Backdoor Attackbackdoor defense	CodeCode Available	2
Shadowcast: Stealthy Data Poisoning Attacks Against Vision-Language Models	Feb 5, 2024	Data AugmentationData Poisoning	CodeCode Available	2
Backdoor Learning: A Survey	Jul 17, 2020	Adversarial AttackBackdoor Attack	CodeCode Available	2
VLMs Can Aggregate Scattered Training Patches	Jun 4, 2025	Data Poisoning	CodeCode Available	1
Data Poisoning in Deep Learning: A Survey	Mar 27, 2025	Data PoisoningDeep Learning	CodeCode Available	1
BackdoorMBTI: A Backdoor Learning Multimodal Benchmark Tool Kit for Backdoor Defense Evaluation	Nov 17, 2024	Action Recognitionbackdoor defense	CodeCode Available	1
PoisonBench: Assessing Large Language Model Vulnerability to Data Poisoning	Oct 11, 2024	Data PoisoningLanguage Modeling	CodeCode Available	1
Fast-FedUL: A Training-Free Federated Unlearning with Provable Skew Resilience	May 28, 2024	Backdoor AttackData Poisoning	CodeCode Available	1
PureGen: Universal Data Purification for Train-Time Poison Defense via Generative Model Dynamics	May 28, 2024	Data PoisoningDenoising	CodeCode Available	1
PureEBM: Universal Poison Purification via Mid-Run Dynamics of Energy-Based Models	May 28, 2024	Data Poisoning	CodeCode Available	1
Optimistic Verifiable Training by Controlling Hardware Nondeterminism	Mar 14, 2024	Data PoisoningGPU	CodeCode Available	1
Learning to Poison Large Language Models for Downstream Manipulation	Feb 21, 2024	Data PoisoningIn-Context Learning	CodeCode Available	1
Data Poisoning based Backdoor Attacks to Contrastive Learning	Jan 1, 2024	Contrastive LearningData Poisoning	CodeCode Available	1
FlowMur: A Stealthy and Practical Audio Backdoor Attack with Limited Knowledge	Dec 15, 2023	Backdoor AttackData Poisoning	CodeCode Available	1
IMMA: Immunizing text-to-image Models against Malicious Adaptation	Nov 30, 2023	Data PoisoningTAG	CodeCode Available	1
Vulnerabilities in AI Code Generators: Exploring Targeted Data Poisoning Attacks	Aug 4, 2023	Code GenerationData Poisoning	CodeCode Available	1
FedDefender: Backdoor Attack Defense in Federated Learning	Jul 2, 2023	Backdoor AttackData Poisoning	CodeCode Available	1
On the Exploitability of Instruction Tuning	Jun 28, 2023	Data PoisoningInstruction Following	CodeCode Available	1
DeepfakeArt Challenge: A Benchmark Dataset for Generative AI Art Forgery and Data Poisoning Detection	Jun 2, 2023	Data Poisoning	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 20Next →

No leaderboard results yet.