SOTAVerified|Agents Browse Leaderboard About

Data Poisoning

Data Poisoning is an adversarial attack that tries to manipulate the training dataset in order to control the prediction behavior of a trained model such that the model will label malicious examples into a desired classes (e.g., labeling spam e-mails as safe).

Source: Explaining Vulnerabilities to Adversarial Machine Learning through Visual Analytics

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 376–400 of 492 papers

Title	Date	Tasks	Status
On the Adversarial Risk of Test Time Adaptation: An Investigation into Realistic Test-Time Data Poisoning	Oct 7, 2024	Data PoisoningTest-time Adaptation	—Unverified
On the Effectiveness of Poisoning against Unsupervised Domain Adaptation	Jun 18, 2021	Data PoisoningDomain Adaptation	—Unverified
RLHFPoison: Reward Poisoning Attack for Reinforcement Learning with Human Feedback in Large Language Models	Nov 16, 2023	Backdoor AttackData Poisoning	—Unverified
On the Relevance of Byzantine Robust Optimization Against Data Poisoning	May 1, 2024	Autonomous DrivingData Poisoning	—Unverified
On the Robustness of Graph Reduction Against GNN Backdoor	Jul 2, 2024	Computational EfficiencyData Poisoning	—Unverified
A Study of Backdoors in Instruction Fine-tuned Language Models	Jun 12, 2024	Data PoisoningLanguage Modelling	—Unverified
Open Challenges in Multi-Agent Security: Towards Secure Systems of Interacting AI Agents	May 4, 2025	Data Poisoning	—Unverified
Optimizing ML Training with Metagradient Descent	Mar 17, 2025	Data Poisoning	—Unverified
Oriole: Thwarting Privacy against Trustworthy Deep Learning Models	Feb 23, 2021	Data PoisoningDeep Learning	—Unverified
OVLA: Neural Network Ownership Verification using Latent Watermarks	Jun 15, 2023	Data Poisoning	—Unverified
PACOL: Poisoning Attacks Against Continual Learners	Nov 18, 2023	Continual LearningData Poisoning	—Unverified
Partner in Crime: Boosting Targeted Poisoning Attacks against Federated Learning	Jul 13, 2024	Data PoisoningFederated Learning	—Unverified
Pick your Poison: Undetectability versus Robustness in Data Poisoning Attacks	May 7, 2023	Data Poisoningimage-classification	—Unverified
PoisHygiene: Detecting and Mitigating Poisoning Attacks in Neural Networks	Mar 24, 2020	Data Poisoning	—Unverified
PoisonedEncoder: Poisoning the Unlabeled Pre-training Data in Contrastive Learning	May 13, 2022	Bilevel OptimizationContrastive Learning	—Unverified
PoisonedParrot: Subtle Data Poisoning Attacks to Elicit Copyright-Infringing Content from Large Language Models	Mar 10, 2025	Data Poisoning	—Unverified
Poisoning Attacks and Defenses on Artificial Intelligence: A Survey	Feb 21, 2022	Data PoisoningSurvey	—Unverified
Poisoning Attacks to Local Differential Privacy Protocols for Trajectory Data	Mar 6, 2025	Data Poisoning	—Unverified
Poisoning Deep Reinforcement Learning Agents with In-Distribution Triggers	Jun 14, 2021	Data PoisoningDeep Reinforcement Learning	—Unverified
Poisoning Programs by Un-Repairing Code: Security Concerns of AI-generated Code	Mar 11, 2024	Code GenerationData Poisoning	—Unverified
Policy Teaching via Data Poisoning in Learning from Human Preferences	Mar 13, 2025	Data Poisoning	—Unverified
Post-Training Overfitting Mitigation in DNN Classifiers	Sep 28, 2023	Data PoisoningDiversity	—Unverified
Practical Data Poisoning Attack against Next-Item Recommendation	Apr 7, 2020	Data PoisoningRecommendation Systems	—Unverified
SLSGD: Secure and Efficient Distributed On-device Machine Learning	Mar 16, 2019	BIG-bench Machine LearningData Poisoning	—Unverified
Practical Poisoning Attacks on Neural Networks	Aug 1, 2020	Data Poisoning	—Unverified

Show:10 25 50

← PrevPage 16 of 20Next →

No leaderboard results yet.