Data Poisoning

Data Poisoning is an adversarial attack that tries to manipulate the training dataset in order to control the prediction behavior of a trained model such that the model will label malicious examples into a desired classes (e.g., labeling spam e-mails as safe).

Source: Explaining Vulnerabilities to Adversarial Machine Learning through Visual Analytics

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 492 papers

Title	Date	Tasks	Status
INK: Inheritable Natural Backdoor Attack Against Model Distillation	Apr 21, 2023	Backdoor AttackData Poisoning	—Unverified
Learning and Unlearning of Fabricated Knowledge in Language Models	Oct 29, 2024	Data PoisoningLanguage Modeling	—Unverified
Learning to Forget using Hypernetworks	Dec 1, 2024	Data PoisoningMachine Unlearning	—Unverified
Local Model Poisoning Attacks to Byzantine-Robust Federated Learning	Nov 26, 2019	BIG-bench Machine LearningData Poisoning	—Unverified
Maximal adversarial perturbations for obfuscation: Hiding certain attributes while preserving rest	Sep 27, 2019	AttributeData Poisoning	—Unverified
Mendata: A Framework to Purify Manipulated Training Data	Dec 3, 2023	Data Poisoning	—Unverified
Mitigating backdoor attacks in LSTM-based Text Classification Systems by Backdoor Keyword Identification	Jul 11, 2020	ClassificationData Poisoning	—Unverified
Mitigating Data Poisoning in Text Classification with Differential Privacy	Nov 1, 2021	ClassificationData Poisoning	—Unverified
Mitigating the Impact of Adversarial Attacks in Very Deep Networks	Dec 8, 2020	Data Poisoning	—Unverified
Mixed Strategy Game Model Against Data Poisoning Attacks	Jun 7, 2019	Data PoisoningModel Poisoning	—Unverified
ML Attack Models: Adversarial Attacks and Data Poisoning Attacks	Dec 6, 2021	Adversarial AttackData Poisoning	—Unverified
How to Backdoor HyperNetwork in Personalized Federated Learning?	Jan 18, 2022	Data PoisoningFederated Learning	—Unverified
Multi-Trigger Poisoning Amplifies Backdoor Vulnerabilities in LLMs	Jul 15, 2025	Data Poisoning	—Unverified
Privacy and Copyright Protection in Generative AI: A Lifecycle Perspective	Nov 30, 2023	Data PoisoningMachine Unlearning	—Unverified
Neural network fragile watermarking with no model performance degradation	Aug 16, 2022	Data Poisoning	—Unverified
Neuromimetic metaplasticity for adaptive continual learning	Jul 9, 2024	Continual LearningData Poisoning	—Unverified
No, of course I can! Refusal Mechanisms Can Be Exploited Using Harmless Fine-Tuning Data	Feb 26, 2025	Data Poisoning	—Unverified
Reclaiming "Open AI" -- AI Model Serving Can Be Open Access, Yet Monetizable and Loyal	Nov 1, 2024	Data Poisoning	—Unverified
On Defending Against Label Flipping Attacks on Malware Detection Systems	Aug 13, 2019	Android Malware DetectionBIG-bench Machine Learning	—Unverified
One Pixel is All I Need	Dec 14, 2024	AllData Poisoning	—Unverified
Data Poisoning to Fake a Nash Equilibrium in Markov Games	Jun 13, 2023	Data PoisoningMulti-agent Reinforcement Learning	—Unverified
Online Data Poisoning Attack	Mar 5, 2019	Data PoisoningDeep Reinforcement Learning	—Unverified
Online Data Poisoning Attacks	Jun 8, 2020	Data PoisoningDeep Reinforcement Learning	—Unverified
On Optimal Learning Under Targeted Data Poisoning	Oct 6, 2022	Data Poisoning	—Unverified
On Practical Aspects of Aggregation Defenses against Data Poisoning Attacks	Jun 28, 2023	Data Poisoning	—Unverified
On the Adversarial Risk of Test Time Adaptation: An Investigation into Realistic Test-Time Data Poisoning	Oct 7, 2024	Data PoisoningTest-time Adaptation	—Unverified
On the Effectiveness of Poisoning against Unsupervised Domain Adaptation	Jun 18, 2021	Data PoisoningDomain Adaptation	—Unverified
RLHFPoison: Reward Poisoning Attack for Reinforcement Learning with Human Feedback in Large Language Models	Nov 16, 2023	Backdoor AttackData Poisoning	—Unverified
On the Relevance of Byzantine Robust Optimization Against Data Poisoning	May 1, 2024	Autonomous DrivingData Poisoning	—Unverified
On the Robustness of Graph Reduction Against GNN Backdoor	Jul 2, 2024	Computational EfficiencyData Poisoning	—Unverified
A Study of Backdoors in Instruction Fine-tuned Language Models	Jun 12, 2024	Data PoisoningLanguage Modelling	—Unverified
Open Challenges in Multi-Agent Security: Towards Secure Systems of Interacting AI Agents	May 4, 2025	Data Poisoning	—Unverified
Optimizing ML Training with Metagradient Descent	Mar 17, 2025	Data Poisoning	—Unverified
Oriole: Thwarting Privacy against Trustworthy Deep Learning Models	Feb 23, 2021	Data PoisoningDeep Learning	—Unverified
OVLA: Neural Network Ownership Verification using Latent Watermarks	Jun 15, 2023	Data Poisoning	—Unverified
PACOL: Poisoning Attacks Against Continual Learners	Nov 18, 2023	Continual LearningData Poisoning	—Unverified
Partner in Crime: Boosting Targeted Poisoning Attacks against Federated Learning	Jul 13, 2024	Data PoisoningFederated Learning	—Unverified
Pick your Poison: Undetectability versus Robustness in Data Poisoning Attacks	May 7, 2023	Data Poisoningimage-classification	—Unverified
PoisHygiene: Detecting and Mitigating Poisoning Attacks in Neural Networks	Mar 24, 2020	Data Poisoning	—Unverified
PoisonedEncoder: Poisoning the Unlabeled Pre-training Data in Contrastive Learning	May 13, 2022	Bilevel OptimizationContrastive Learning	—Unverified
PoisonedParrot: Subtle Data Poisoning Attacks to Elicit Copyright-Infringing Content from Large Language Models	Mar 10, 2025	Data Poisoning	—Unverified
Poisoning Attacks and Defenses on Artificial Intelligence: A Survey	Feb 21, 2022	Data PoisoningSurvey	—Unverified
Poisoning Attacks to Local Differential Privacy Protocols for Trajectory Data	Mar 6, 2025	Data Poisoning	—Unverified
Poisoning Deep Reinforcement Learning Agents with In-Distribution Triggers	Jun 14, 2021	Data PoisoningDeep Reinforcement Learning	—Unverified
Poisoning Programs by Un-Repairing Code: Security Concerns of AI-generated Code	Mar 11, 2024	Code GenerationData Poisoning	—Unverified
Policy Teaching via Data Poisoning in Learning from Human Preferences	Mar 13, 2025	Data Poisoning	—Unverified
Post-Training Overfitting Mitigation in DNN Classifiers	Sep 28, 2023	Data PoisoningDiversity	—Unverified
Practical Data Poisoning Attack against Next-Item Recommendation	Apr 7, 2020	Data PoisoningRecommendation Systems	—Unverified
SLSGD: Secure and Efficient Distributed On-device Machine Learning	Mar 16, 2019	BIG-bench Machine LearningData Poisoning	—Unverified
Practical Poisoning Attacks on Neural Networks	Aug 1, 2020	Data Poisoning	—Unverified

Show:10 25 50

← PrevPage 8 of 10Next →

No leaderboard results yet.