Adversarial Attack

An Adversarial Attack is a technique to find a perturbation that changes the prediction of a machine learning model. The perturbation can be very small and imperceptible to human eyes.

Source: Recurrent Attention Model with Log-Polar Mapping is Robust against Adversarial Attacks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 451–475 of 1808 papers

Title	Date	Tasks	Status
Adversarial Robustness for Deep Learning-based Wildfire Prediction Models	Dec 28, 2024	Adversarial AttackAdversarial Robustness	—Unverified
Attribution for Enhanced Explanation with Transferable Adversarial eXploration	Dec 27, 2024	Adversarial AttackDiversity	—Unverified
Robustness-aware Automatic Prompt Optimization	Dec 24, 2024	Adversarial Attack	CodeCode Available
An Empirical Analysis of Federated Learning Models Subject to Label-Flipping Adversarial Attack	Dec 24, 2024	Adversarial AttackFederated Learning	—Unverified
SurvAttack: Black-Box Attack On Survival Models through Ontology-Informed EHR Perturbation	Dec 24, 2024	Adversarial Attackcounterfactual	—Unverified
Retention Score: Quantifying Jailbreak Risks for Vision Language Models	Dec 23, 2024	Adversarial Attack	—Unverified
ErasableMask: A Robust and Erasable Privacy Protection Scheme against Black-box Face Recognition Models	Dec 22, 2024	Adversarial AttackFace Recognition	—Unverified
Preventing Non-intrusive Load Monitoring Privacy Invasion: A Precise Adversarial Attack Scheme for Networked Smart Meters	Dec 22, 2024	Adversarial AttackNon-Intrusive Load Monitoring	—Unverified
Adversarial Attack Against Images Classification based on Generative Adversarial Networks	Dec 21, 2024	Adversarial AttackDecision Making	—Unverified
PB-UAP: Hybrid Universal Adversarial Attack For Image Segmentation	Dec 21, 2024	Adversarial Attackimage-classification	—Unverified
Adversarial Robustness through Dynamic Ensemble Learning	Dec 20, 2024	Adversarial AttackAdversarial Robustness	—Unverified
Watertox: The Art of Simplicity in Universal Attacks A Cross-Model Framework for Robust Adversarial Generation	Dec 20, 2024	Adversarial AttackDiversity	—Unverified
Adversarially robust generalization theory via Jacobian regularization for deep neural networks	Dec 17, 2024	Adversarial Attack	—Unverified
Unpacking the Resilience of SNLI Contradiction Examples to Attacks	Dec 15, 2024	Adversarial Attack	CodeCode Available
RAT: Adversarial Attacks on Deep Reinforcement Agents for Targeted Behaviors	Dec 14, 2024	Adversarial AttackDeep Reinforcement Learning	—Unverified
AHSG: Adversarial Attack on High-level Semantics in Graph Neural Networks	Dec 10, 2024	Adversarial AttackGraph Learning	—Unverified
A Generative Victim Model for Segmentation	Dec 10, 2024	Adversarial AttackImage Generation	—Unverified
Take Fake as Real: Realistic-like Robust Black-box Adversarial Attack to Evade AIGC Detection	Dec 9, 2024	Adversarial Attack	—Unverified
From Flexibility to Manipulation: The Slippery Slope of XAI Evaluation	Dec 7, 2024	Adversarial AttackExplainable artificial intelligence	CodeCode Available
Less is More: A Stealthy and Efficient Adversarial Attack Method for DRL-based Autonomous Driving Policies	Dec 4, 2024	Adversarial AttackAutonomous Driving	—Unverified
Does Safety Training of LLMs Generalize to Semantically Related Natural Prompts?	Dec 4, 2024	Adversarial Attack	—Unverified
Pay Attention to the Robustness of Chinese Minority Language Models! Syllable-level Textual Adversarial Attack on Tibetan Script	Dec 3, 2024	Adversarial Attack	CodeCode Available
Hijacking Vision-and-Language Navigation Agents with Adversarial Environmental Attacks	Dec 3, 2024	Adversarial AttackVision and Language Navigation	—Unverified
Multi-Granularity Tibetan Textual Adversarial Attack Method Based on Masked Language Model	Dec 3, 2024	Adversarial AttackHate Speech Detection	CodeCode Available
Intermediate Outputs Are More Sensitive Than You Think	Dec 1, 2024	Adversarial AttackSensitivity	—Unverified

Show:10 25 50

← PrevPage 19 of 73Next →

All datasets CIFAR-10 CIFAR-100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Xu et al.	Attack: PGD20	78.68	—	Unverified
2	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	78.13	—	Unverified
3	TRADES-ANCRA/ResNet18	Attack: AutoAttack	59.7	—	Unverified
4	AdvTraining [madry2018]	Attack: PGD20	48.44	—	Unverified
5	TRADES [zhang2019b]	Attack: PGD20	45.9	—	Unverified
6	XU-Net	Robust Accuracy	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	51.28	—	Unverified
2	multi-resolution self-ensembles	Attack: AutoAttack	47.85	—	Unverified