Adversarial Attack

An Adversarial Attack is a technique to find a perturbation that changes the prediction of a machine learning model. The perturbation can be very small and imperceptible to human eyes.

Source: Recurrent Attention Model with Log-Polar Mapping is Robust against Adversarial Attacks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–100 of 1808 papers

Title	Date	Tasks	Status	Hype
EaTVul: ChatGPT-based Evasion Attack Against Software Vulnerability Detection	Jul 27, 2024	Adversarial AttackVulnerability Detection	CodeCode Available	1
PG-Attack: A Precision-Guided Adversarial Attack Framework Against Vision Foundation Models for Autonomous Driving	Jul 18, 2024	Adversarial AttackAutonomous Driving	CodeCode Available	1
Controlling Whisper: Universal Acoustic Adversarial Attacks to Control Speech Foundation Models	Jul 5, 2024	Adversarial AttackAutomatic Speech Recognition	CodeCode Available	1
Adversarial Magnification to Deceive Deepfake Detection through Super Resolution	Jul 2, 2024	Adversarial AttackDeepFake Detection	CodeCode Available	1
DifAttack++: Query-Efficient Black-Box Adversarial Attack via Hierarchical Disentangled Feature Space in Cross-Domain	Jun 5, 2024	Adversarial AttackDisentanglement	CodeCode Available	1
Constrained Adaptive Attack: Effective Adversarial Attack Against Deep Neural Networks for Tabular Data	Jun 2, 2024	Adversarial AttackAdversarial Robustness	CodeCode Available	1
Disrupting Diffusion: Token-Level Attention Erasure Attack against Diffusion-based Customization	May 31, 2024	Adversarial AttackImage Generation	CodeCode Available	1
Muting Whisper: A Universal Acoustic Adversarial Attack on Speech Foundation Models	May 9, 2024	Adversarial AttackAutomatic Speech Recognition	CodeCode Available	1
Universal Adversarial Perturbations for Vision-Language Pre-trained Models	May 9, 2024	Adversarial AttackAdversarial Robustness	CodeCode Available	1
Revisiting Character-level Adversarial Attacks for Language Models	May 7, 2024	Adversarial AttackSentence	CodeCode Available	1
An Analysis of Recent Advances in Deepfake Image Detection in an Evolving Threat Landscape	Apr 24, 2024	Adversarial AttackFace Swapping	CodeCode Available	1
epsilon-Mesh Attack: A Surface-based Adversarial Point Cloud Attack for Facial Expression Recognition	Mar 11, 2024	Adversarial AttackFacial Expression Recognition	CodeCode Available	1
Hide in Thicket: Generating Imperceptible and Rational Adversarial Perturbations on 3D Point Clouds	Mar 8, 2024	3D Point Cloud ClassificationAdversarial Attack	CodeCode Available	1
RAUCA: A Novel Physical Adversarial Attack on Vehicle Detectors via Robust and Accurate Camouflage Generation	Feb 24, 2024	Adversarial AttackNeural Rendering	CodeCode Available	1
On the Multi-modal Vulnerability of Diffusion Models	Feb 2, 2024	Adversarial AttackImage Generation	CodeCode Available	1
Benchmarking Transferable Adversarial Attacks	Feb 1, 2024	Adversarial AttackBenchmarking	CodeCode Available	1
Fluent dreaming for language models	Jan 24, 2024	Adversarial AttackLanguage Modeling	CodeCode Available	1
The Effect of Intrinsic Dataset Properties on Generalization: Unraveling Learning Differences Between Natural and Medical Images	Jan 16, 2024	Adversarial AttackAdversarial Robustness	CodeCode Available	1
Revealing Vulnerabilities in Stable Diffusion via Targeted Attacks	Jan 16, 2024	Adversarial AttackImage Generation	CodeCode Available	1
GE-AdvGAN: Improving the transferability of adversarial samples by gradient editing-based adversarial generative model	Jan 11, 2024	Adversarial Attack	CodeCode Available	1
SlowFormer: Adversarial Attack on Compute and Energy Consumption of Efficient Vision Transformers	Jan 1, 2024	Adversarial Attack	CodeCode Available	1
Transferable Structural Sparse Adversarial Attack Via Exact Group Sparsity Training	Jan 1, 2024	Adversarial Attackimage-classification	CodeCode Available	1
Towards Transferable Targeted 3D Adversarial Attack in the Physical World	Dec 15, 2023	Adversarial AttackNeRF	CodeCode Available	1
AVA: Inconspicuous Attribute Variation-based Adversarial Attack bypassing DeepFake Detection	Dec 14, 2023	Adversarial AttackAttribute	CodeCode Available	1
An Extensive Study on Adversarial Attack against Pre-trained Models of Code	Nov 13, 2023	Adversarial Attack	CodeCode Available	1
AutoDAN: Interpretable Gradient-Based Adversarial Attacks on Large Language Models	Oct 23, 2023	Adversarial AttackBlocking	CodeCode Available	1
Targeted Attack Improves Protection against Unauthorized Diffusion Customization	Oct 7, 2023	Adversarial AttackImage Generation	CodeCode Available	1
Robustness of AI-Image Detectors: Fundamental Limits and Practical Attacks	Sep 29, 2023	Adversarial AttackFace Swapping	CodeCode Available	1
Structure Invariant Transformation for better Adversarial Transferability	Sep 26, 2023	Adversarial AttackDiversity	CodeCode Available	1
Semantic Adversarial Attacks via Diffusion Models	Sep 14, 2023	Adversarial Attack	CodeCode Available	1
RAIN: Your Language Models Can Align Themselves without Finetuning	Sep 13, 2023	Adversarial AttackTruthfulQA	CodeCode Available	1
Differentiable JPEG: The Devil is in the Details	Sep 13, 2023	Adversarial AttackQuantization	CodeCode Available	1
Certifying LLM Safety against Adversarial Prompting	Sep 6, 2023	Adversarial AttackLanguage Modelling	CodeCode Available	1
PatchBackdoor: Backdoor Attack against Deep Neural Networks without Model Modification	Aug 22, 2023	Adversarial AttackBackdoor Attack	CodeCode Available	1
On the Adversarial Robustness of Multi-Modal Foundation Models	Aug 21, 2023	Adversarial AttackAdversarial Robustness	CodeCode Available	1
Hard No-Box Adversarial Attack on Skeleton-Based Human Action Recognition with Skeleton-Motion-Informed Gradient	Aug 10, 2023	Action RecognitionActivity Recognition	CodeCode Available	1
An Adaptive Model Ensemble Adversarial Attack for Boosting Adversarial Transferability	Aug 5, 2023	Adversarial Attack	CodeCode Available	1
Multi-attacks: Many images + the same adversarial attack many target labels	Aug 4, 2023	Adversarial Attack	CodeCode Available	1
AdvDiff: Generating Unrestricted Adversarial Examples using Diffusion Models	Jul 24, 2023	Adversarial AttackAdversarial Defense	CodeCode Available	1
OUTFOX: LLM-Generated Essay Detection Through In-Context Learning with Adversarially Generated Examples	Jul 21, 2023	Adversarial AttackAdversarial Attack Detection	CodeCode Available	1
Frequency Domain Adversarial Training for Robust Volumetric Medical Segmentation	Jul 14, 2023	Adversarial AttackDeep Learning	CodeCode Available	1
Adversarial Attack On Yolov5 For Traffic And Road Sign Detection	May 27, 2023	Adversarial Attackobject-detection	CodeCode Available	1
Towards Benchmarking and Assessing Visual Naturalness of Physical World Adversarial Attacks	May 22, 2023	Adversarial AttackAutonomous Driving	CodeCode Available	1
White-Box Multi-Objective Adversarial Attack on Dialogue Generation	May 5, 2023	Adversarial AttackDecision Making	CodeCode Available	1
Fooling the Image Dehazing Models by First Order Gradient	Mar 30, 2023	Adversarial AttackImage Dehazing	CodeCode Available	1
A Pilot Study of Query-Free Adversarial Attack against Stable Diffusion	Mar 29, 2023	Adversarial AttackAdversarial Robustness	CodeCode Available	1
Feature Separation and Recalibration for Adversarial Robustness	Mar 24, 2023	Adversarial AttackAdversarial Robustness	CodeCode Available	1
X-Adv: Physical Adversarial Object Attacks against X-ray Prohibited Item Detection	Feb 19, 2023	Adversarial Attack	CodeCode Available	1
StyleAdv: Meta Style Adversarial Training for Cross-Domain Few-Shot Learning	Feb 18, 2023	Adversarial AttackCross-Domain Few-Shot	CodeCode Available	1
Robust Mid-Pass Filtering Graph Convolutional Networks	Feb 16, 2023	Adversarial AttackNode Classification	CodeCode Available	1

Show:10 25 50

← PrevPage 2 of 37Next →

All datasets CIFAR-10 CIFAR-100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Xu et al.	Attack: PGD20	78.68	—	Unverified
2	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	78.13	—	Unverified
3	TRADES-ANCRA/ResNet18	Attack: AutoAttack	59.7	—	Unverified
4	AdvTraining [madry2018]	Attack: PGD20	48.44	—	Unverified
5	TRADES [zhang2019b]	Attack: PGD20	45.9	—	Unverified
6	XU-Net	Robust Accuracy	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	51.28	—	Unverified
2	multi-resolution self-ensembles	Attack: AutoAttack	47.85	—	Unverified