Adversarial Attack

An Adversarial Attack is a technique to find a perturbation that changes the prediction of a machine learning model. The perturbation can be very small and imperceptible to human eyes.

Source: Recurrent Attention Model with Log-Polar Mapping is Robust against Adversarial Attacks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 376–400 of 1808 papers

Title	Date	Tasks	Status	Hype
Robust Deep Reinforcement Learning Through Adversarial Attacks and Training : A Survey	Mar 1, 2024	Adversarial AttackDeep Reinforcement Learning	—Unverified	0
Unraveling Adversarial Examples against Speaker Identification -- Techniques for Attack Detection and Victim Model Classification	Feb 29, 2024	Adversarial AttackClassification	—Unverified	0
Enhancing Tracking Robustness with Auxiliary Adversarial Defense Networks	Feb 28, 2024	Adversarial AttackAdversarial Defense	—Unverified	0
Conformal Shield: A Novel Adversarial Attack Detection Framework for Automatic Modulation Classification	Feb 27, 2024	Adversarial AttackAdversarial Attack Detection	—Unverified	0
Extreme Miscalibration and the Illusion of Adversarial Robustness	Feb 27, 2024	Adversarial AttackAdversarial Robustness	—Unverified	0
Improving the JPEG-resistance of Adversarial Attacks on Face Recognition by Interpolation Smoothing	Feb 26, 2024	Adversarial AttackFace Recognition	—Unverified	0
RAUCA: A Novel Physical Adversarial Attack on Vehicle Detectors via Robust and Accurate Camouflage Generation	Feb 24, 2024	Adversarial AttackNeural Rendering	CodeCode Available	1
LLMs Can Defend Themselves Against Jailbreaking in a Practical Manner: A Vision Paper	Feb 24, 2024	Adversarial AttackSafety Alignment	—Unverified	0
Fast Adversarial Attacks on Language Models In One GPU Minute	Feb 23, 2024	Adversarial AttackComputational Efficiency	CodeCode Available	2
Noise-BERT: A Unified Perturbation-Robust Framework with Noise Alignment Pre-training for Noisy Slot Filling Task	Feb 22, 2024	Adversarial AttackContrastive Learning	—Unverified	0
Beyond Worst-case Attacks: Robust RL with Adaptive Defense via Non-dominated Policies	Feb 20, 2024	Adversarial AttackMuJoCo	CodeCode Available	0
An Adversarial Approach to Evaluating the Robustness of Event Identification Models	Feb 19, 2024	Adversarial AttackClassification	—Unverified	0
AICAttack: Adversarial Image Captioning Attack with Attention-Based Optimization	Feb 19, 2024	Adversarial AttackImage Captioning	CodeCode Available	0
Only My Model On My Data: A Privacy Preserving Approach Protecting one Model and Deceiving Unauthorized Black-Box Models	Feb 14, 2024	Adversarial AttackClassification	—Unverified	0
Accuracy of TextFooler black box adversarial attacks on 01 loss sign activation neural network ensemble	Feb 12, 2024	Adversarial AttackClassification	CodeCode Available	0
Corruption Robust Offline Reinforcement Learning with Human Feedback	Feb 9, 2024	Adversarial Attackreinforcement-learning	—Unverified	0
TETRIS: Towards Exploring the Robustness of Interactive Segmentation	Feb 9, 2024	Adversarial AttackAdversarial Robustness	—Unverified	0
FoolSDEdit: Deceptively Steering Your Edits Towards Targeted Attribute-aware Distribution	Feb 6, 2024	Adversarial AttackAttribute	—Unverified	0
PROSAC: Provably Safe Certification for Machine Learning Models under Adversarial Attacks	Feb 4, 2024	Adversarial AttackBayesian Optimization	—Unverified	0
DeSparsify: Adversarial Attack Against Token Sparsification Mechanisms in Vision Transformers	Feb 4, 2024	Adversarial AttackGPU	CodeCode Available	0
Analyzing Sentiment Polarity Reduction in News Presentation through Contextual Perturbation and Large Language Models	Feb 3, 2024	Adversarial AttackLanguage Modeling	—Unverified	0
HQA-Attack: Toward High Quality Black-Box Hard-Label Adversarial Attack on Text	Feb 2, 2024	Adversarial AttackHard-label Attack	CodeCode Available	0
On the Multi-modal Vulnerability of Diffusion Models	Feb 2, 2024	Adversarial AttackImage Generation	CodeCode Available	1
SignSGD with Federated Defense: Harnessing Adversarial Attacks through Gradient Sign Decoding	Feb 2, 2024	Adversarial AttackQuantization	CodeCode Available	0
STAA-Net: A Sparse and Transferable Adversarial Attack for Speech Emotion Recognition	Feb 2, 2024	Adversarial AttackEmotion Recognition	—Unverified	0

Show:10 25 50

← PrevPage 16 of 73Next →

All datasets CIFAR-10 CIFAR-100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Xu et al.	Attack: PGD20	78.68	—	Unverified
2	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	78.13	—	Unverified
3	TRADES-ANCRA/ResNet18	Attack: AutoAttack	59.7	—	Unverified
4	AdvTraining [madry2018]	Attack: PGD20	48.44	—	Unverified
5	TRADES [zhang2019b]	Attack: PGD20	45.9	—	Unverified
6	XU-Net	Robust Accuracy	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	51.28	—	Unverified
2	multi-resolution self-ensembles	Attack: AutoAttack	47.85	—	Unverified