Adversarial Attack

An Adversarial Attack is a technique to find a perturbation that changes the prediction of a machine learning model. The perturbation can be very small and imperceptible to human eyes.

Source: Recurrent Attention Model with Log-Polar Mapping is Robust against Adversarial Attacks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–350 of 1808 papers

Title	Date	Tasks	Status	Hype
Imperceptible Face Forgery Attack via Adversarial Semantic Mask	Jun 16, 2024	Adversarial Attack	CodeCode Available	0
Explainable Graph Neural Networks Under Fire	Jun 10, 2024	Adversarial Attack	CodeCode Available	0
DMS: Addressing Information Loss with More Steps for Pragmatic Adversarial Attacks	Jun 9, 2024	Adversarial Attack	—Unverified	0
SelfDefend: LLMs Can Defend Themselves against Jailbreaking in a Practical Manner	Jun 8, 2024	Adversarial AttackLLM Jailbreak	—Unverified	0
VQUNet: Vector Quantization U-Net for Defending Adversarial Atacks by Regularizing Unwanted Noise	Jun 5, 2024	Adversarial AttackQuantization	—Unverified	0
Graph Neural Network Explanations are Fragile	Jun 5, 2024	Adversarial AttackGraph Neural Network	CodeCode Available	0
DifAttack++: Query-Efficient Black-Box Adversarial Attack via Hierarchical Disentangled Feature Space in Cross-Domain	Jun 5, 2024	Adversarial AttackDisentanglement	CodeCode Available	1
SVASTIN: Sparse Video Adversarial Attack via Spatio-Temporal Invertible Neural Networks	Jun 4, 2024	Adversarial Attack	CodeCode Available	0
Constrained Adaptive Attack: Effective Adversarial Attack Against Deep Neural Networks for Tabular Data	Jun 2, 2024	Adversarial AttackAdversarial Robustness	CodeCode Available	1
Disrupting Diffusion: Token-Level Attention Erasure Attack against Diffusion-based Customization	May 31, 2024	Adversarial AttackImage Generation	CodeCode Available	1
Efficient Black-box Adversarial Attacks via Bayesian Optimization Guided by a Function Prior	May 29, 2024	Adversarial AttackBayesian Optimization	CodeCode Available	0
Wavelet-Based Image Tokenizer for Vision Transformers	May 28, 2024	Adversarial Attack	—Unverified	0
Breaking the False Sense of Security in Backdoor Defense through Re-Activation Attack	May 25, 2024	Adversarial Attackbackdoor defense	—Unverified	0
Uncertainty Measurement of Deep Learning System based on the Convex Hull of Training Sets	May 25, 2024	Adversarial Attack	—Unverified	0
Adversarial Attacks on Hidden Tasks in Multi-Task Learning	May 24, 2024	Adversarial AttackMulti-Task Learning	—Unverified	0
Rethinking Independent Cross-Entropy Loss For Graph-Structured Data	May 24, 2024	Adversarial AttackNode Classification	CodeCode Available	0
AdjointDEIS: Efficient Gradients for Diffusion Models	May 23, 2024	Adversarial Attack	CodeCode Available	0
LookHere: Vision Transformers with Directed Attention Generalize and Extrapolate	May 22, 2024	Adversarial AttackAttribute	CodeCode Available	0
Trustworthy Actionable Perturbations	May 18, 2024	Adversarial Attackcounterfactual	—Unverified	0
Safeguarding Vision-Language Models Against Patched Visual Prompt Injectors	May 17, 2024	Adversarial Attack	—Unverified	0
Adversarial Robustness for Visual Grounding of Multimodal Large Language Models	May 16, 2024	Adversarial AttackAdversarial Robustness	CodeCode Available	0
DiffAM: Diffusion-based Adversarial Makeup Transfer for Facial Privacy Protection	May 16, 2024	Adversarial AttackFace Recognition	CodeCode Available	2
Towards Evaluating the Robustness of Automatic Speech Recognition Systems via Audio Style Transfer	May 15, 2024	Adversarial AttackAutomatic Speech Recognition	—Unverified	0
Disttack: Graph Adversarial Attacks Toward Distributed GNN Training	May 10, 2024	Adversarial AttackGraph Learning	CodeCode Available	0
Improving Transferable Targeted Adversarial Attack via Normalized Logit Calibration and Truncated Feature Mixing	May 10, 2024	Adversarial Attack	—Unverified	0
Muting Whisper: A Universal Acoustic Adversarial Attack on Speech Foundation Models	May 9, 2024	Adversarial AttackAutomatic Speech Recognition	CodeCode Available	1
BB-Patch: BlackBox Adversarial Patch-Attack using Zeroth-Order Optimization	May 9, 2024	Adversarial AttackDeep Learning	—Unverified	0
Universal Adversarial Perturbations for Vision-Language Pre-trained Models	May 9, 2024	Adversarial AttackAdversarial Robustness	CodeCode Available	1
Untargeted Adversarial Attack on Knowledge Graph Embeddings	May 8, 2024	Adversarial AttackGraph Embedding	—Unverified	0
Revisiting Character-level Adversarial Attacks for Language Models	May 7, 2024	Adversarial AttackSentence	CodeCode Available	1
To Each (Textual Sequence) Its Own: Improving Memorized-Data Unlearning in Large Language Models	May 6, 2024	Adversarial AttackMemorization	—Unverified	0
Probing Unlearned Diffusion Models: A Transferable Adversarial Attack Perspective	Apr 30, 2024	Adversarial Attack	CodeCode Available	0
An Analysis of Recent Advances in Deepfake Image Detection in an Evolving Threat Landscape	Apr 24, 2024	Adversarial AttackFace Swapping	CodeCode Available	1
A General Black-box Adversarial Attack on Graph-based Fake News Detectors	Apr 24, 2024	Adversarial AttackGraph Neural Network	—Unverified	0
DIP-Watermark: A Double Identity Protection Method Based on Robust Adversarial Watermark	Apr 23, 2024	Adversarial AttackDecoder	—Unverified	0
Beyond Score Changes: Adversarial Attack on No-Reference Image Quality Assessment from Two Perspectives	Apr 20, 2024	Adversarial AttackImage Quality Assessment	—Unverified	0
AED-PADA:Improving Generalizability of Adversarial Example Detection via Principal Adversarial Domain Adaptation	Apr 19, 2024	Adversarial AttackAdversarial Defense	—Unverified	0
SA-Attack: Speed-adaptive stealthy adversarial attack on trajectory prediction	Apr 19, 2024	Adversarial AttackPrediction	CodeCode Available	0
Adversarial Identity Injection for Semantic Face Image Synthesis	Apr 16, 2024	Adversarial AttackFace Generation	—Unverified	0
Towards a Novel Perspective on Adversarial Examples Driven by Frequency	Apr 16, 2024	Adversarial Attack	—Unverified	0
Counterfactual Explanations for Face Forgery Detection via Adversarial Removal of Artifacts	Apr 12, 2024	Adversarial Attackcounterfactual	CodeCode Available	0
Towards Building a Robust Toxicity Predictor	Apr 9, 2024	Adversarial Attack	—Unverified	0
BruSLeAttack: A Query-Efficient Score-Based Black-Box Sparse Adversarial Attack	Apr 8, 2024	Adversarial Attack	—Unverified	0
Adversarial Attacks and Dimensionality in Text Classifiers	Apr 3, 2024	Adversarial AttackAdversarial Defense	—Unverified	0
Jailbreaking Prompt Attack: A Controllable Adversarial Attack against Diffusion Models	Apr 2, 2024	Adversarial AttackImage Generation	—Unverified	0
READ: Improving Relation Extraction from an ADversarial Perspective	Apr 2, 2024	Adversarial AttackRelation	CodeCode Available	0
Multi-granular Adversarial Attacks against Black-box Neural Ranking Models	Apr 2, 2024	Adversarial AttackDecision Making	—Unverified	0
Patch Synthesis for Property Repair of Deep Neural Networks	Apr 2, 2024	Adversarial Attack	—Unverified	0
Humanizing Machine-Generated Content: Evading AI-Text Detection through Adversarial Attack	Apr 2, 2024	Adversarial AttackText Detection	CodeCode Available	2
The Double-Edged Sword of Input Perturbations to Robust Accurate Fairness	Apr 1, 2024	Adversarial AttackFairness	—Unverified	0

Show:10 25 50

← PrevPage 7 of 37Next →

All datasets CIFAR-10 CIFAR-100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Xu et al.	Attack: PGD20	78.68	—	Unverified
2	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	78.13	—	Unverified
3	TRADES-ANCRA/ResNet18	Attack: AutoAttack	59.7	—	Unverified
4	AdvTraining [madry2018]	Attack: PGD20	48.44	—	Unverified
5	TRADES [zhang2019b]	Attack: PGD20	45.9	—	Unverified
6	XU-Net	Robust Accuracy	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	51.28	—	Unverified
2	multi-resolution self-ensembles	Attack: AutoAttack	47.85	—	Unverified