Adversarial Attack

An Adversarial Attack is a technique to find a perturbation that changes the prediction of a machine learning model. The perturbation can be very small and imperceptible to human eyes.

Source: Recurrent Attention Model with Log-Polar Mapping is Robust against Adversarial Attacks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 326–350 of 1808 papers

Title	Date	Tasks	Status	Hype
Muting Whisper: A Universal Acoustic Adversarial Attack on Speech Foundation Models	May 9, 2024	Adversarial AttackAutomatic Speech Recognition	CodeCode Available	1
BB-Patch: BlackBox Adversarial Patch-Attack using Zeroth-Order Optimization	May 9, 2024	Adversarial AttackDeep Learning	—Unverified	0
Universal Adversarial Perturbations for Vision-Language Pre-trained Models	May 9, 2024	Adversarial AttackAdversarial Robustness	CodeCode Available	1
Untargeted Adversarial Attack on Knowledge Graph Embeddings	May 8, 2024	Adversarial AttackGraph Embedding	—Unverified	0
Revisiting Character-level Adversarial Attacks for Language Models	May 7, 2024	Adversarial AttackSentence	CodeCode Available	1
To Each (Textual Sequence) Its Own: Improving Memorized-Data Unlearning in Large Language Models	May 6, 2024	Adversarial AttackMemorization	—Unverified	0
Probing Unlearned Diffusion Models: A Transferable Adversarial Attack Perspective	Apr 30, 2024	Adversarial Attack	CodeCode Available	0
An Analysis of Recent Advances in Deepfake Image Detection in an Evolving Threat Landscape	Apr 24, 2024	Adversarial AttackFace Swapping	CodeCode Available	1
A General Black-box Adversarial Attack on Graph-based Fake News Detectors	Apr 24, 2024	Adversarial AttackGraph Neural Network	—Unverified	0
DIP-Watermark: A Double Identity Protection Method Based on Robust Adversarial Watermark	Apr 23, 2024	Adversarial AttackDecoder	—Unverified	0
Beyond Score Changes: Adversarial Attack on No-Reference Image Quality Assessment from Two Perspectives	Apr 20, 2024	Adversarial AttackImage Quality Assessment	—Unverified	0
AED-PADA:Improving Generalizability of Adversarial Example Detection via Principal Adversarial Domain Adaptation	Apr 19, 2024	Adversarial AttackAdversarial Defense	—Unverified	0
SA-Attack: Speed-adaptive stealthy adversarial attack on trajectory prediction	Apr 19, 2024	Adversarial AttackPrediction	CodeCode Available	0
Adversarial Identity Injection for Semantic Face Image Synthesis	Apr 16, 2024	Adversarial AttackFace Generation	—Unverified	0
Towards a Novel Perspective on Adversarial Examples Driven by Frequency	Apr 16, 2024	Adversarial Attack	—Unverified	0
Counterfactual Explanations for Face Forgery Detection via Adversarial Removal of Artifacts	Apr 12, 2024	Adversarial Attackcounterfactual	CodeCode Available	0
Towards Building a Robust Toxicity Predictor	Apr 9, 2024	Adversarial Attack	—Unverified	0
BruSLeAttack: A Query-Efficient Score-Based Black-Box Sparse Adversarial Attack	Apr 8, 2024	Adversarial Attack	—Unverified	0
Adversarial Attacks and Dimensionality in Text Classifiers	Apr 3, 2024	Adversarial AttackAdversarial Defense	—Unverified	0
Jailbreaking Prompt Attack: A Controllable Adversarial Attack against Diffusion Models	Apr 2, 2024	Adversarial AttackImage Generation	—Unverified	0
READ: Improving Relation Extraction from an ADversarial Perspective	Apr 2, 2024	Adversarial AttackRelation	CodeCode Available	0
Multi-granular Adversarial Attacks against Black-box Neural Ranking Models	Apr 2, 2024	Adversarial AttackDecision Making	—Unverified	0
Patch Synthesis for Property Repair of Deep Neural Networks	Apr 2, 2024	Adversarial Attack	—Unverified	0
Humanizing Machine-Generated Content: Evading AI-Text Detection through Adversarial Attack	Apr 2, 2024	Adversarial AttackText Detection	CodeCode Available	2
The Double-Edged Sword of Input Perturbations to Robust Accurate Fairness	Apr 1, 2024	Adversarial AttackFairness	—Unverified	0

Show:10 25 50

← PrevPage 14 of 73Next →

All datasets CIFAR-10 CIFAR-100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Xu et al.	Attack: PGD20	78.68	—	Unverified
2	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	78.13	—	Unverified
3	TRADES-ANCRA/ResNet18	Attack: AutoAttack	59.7	—	Unverified
4	AdvTraining [madry2018]	Attack: PGD20	48.44	—	Unverified
5	TRADES [zhang2019b]	Attack: PGD20	45.9	—	Unverified
6	XU-Net	Robust Accuracy	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	51.28	—	Unverified
2	multi-resolution self-ensembles	Attack: AutoAttack	47.85	—	Unverified