Adversarial Attack

An Adversarial Attack is a technique to find a perturbation that changes the prediction of a machine learning model. The perturbation can be very small and imperceptible to human eyes.

Source: Recurrent Attention Model with Log-Polar Mapping is Robust against Adversarial Attacks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1076–1100 of 1808 papers

Title	Date	Tasks	Status
Symmetric Saliency-based Adversarial Attack To Speaker Identification	Oct 30, 2022	Adversarial AttackDecoder	—Unverified
Tactics of Adversarial Attack on Deep Reinforcement Learning Agents	Mar 8, 2017	Adversarial AttackAtari Games	—Unverified
Take Fake as Real: Realistic-like Robust Black-box Adversarial Attack to Evade AIGC Detection	Dec 9, 2024	Adversarial Attack	—Unverified
Targeted Adversarial Attacks against Neural Network Trajectory Predictors	Dec 8, 2022	Adversarial AttackTrajectory Forecasting	—Unverified
Effective Targeted Attacks for Adversarial Self-Supervised Learning	Oct 19, 2022	Adversarial AttackSelf-Supervised Learning	—Unverified
Targeted Attacks on Timeseries Forecasting	Jan 27, 2023	Adversarial AttackTime Series	—Unverified
Target Model Agnostic Adversarial Attacks with Query Budgets on Language Understanding Models	Jun 13, 2021	Adversarial AttackNatural Language Understanding	—Unverified
TASA: Twin Answer Sentences Attack for Adversarial Context Generation in Question Answering	Dec 17, 2021	Adversarial AttackQuestion Answering	—Unverified
TEAM: Temporal Adversarial Examples Attack Model against Network Intrusion Detection System Applied to RNN	Sep 19, 2024	Adversarial AttackIntrusion Detection	—Unverified
Temporal Sparse Adversarial Attack on Sequence-based Gait Recognition	Feb 22, 2020	Adversarial AttackGait Recognition	—Unverified
TenAd: A Tensor-based Low-rank Black Box Adversarial Attack for Video Classification	Apr 1, 2025	Adversarial AttackVideo Classification	—Unverified
TESSER: Transfer-Enhancing Adversarial Attacks from Vision Transformers via Spectral and Semantic Regularization	May 26, 2025	Adversarial Attack	—Unverified
TETRIS: Towards Exploring the Robustness of Interactive Segmentation	Feb 9, 2024	Adversarial AttackAdversarial Robustness	—Unverified
TextAttack: Lessons learned in designing Python frameworks for NLP	Nov 1, 2020	Adversarial AttackData Augmentation	—Unverified
TextDefense: Adversarial Text Detection based on Word Importance Entropy	Feb 12, 2023	Adversarial AttackAdversarial Text	—Unverified
TextFlint: Unified Multilingual Robustness Evaluation Toolkit for Natural Language Processing	Mar 21, 2021	Adversarial Attacknamed-entity-recognition	—Unverified
Agents Under Siege: Breaking Pragmatic Multi-Agent LLM Systems with Optimized Prompt Attacks	Mar 31, 2025	Adversarial AttackLarge Language Model	—Unverified
TextShield: Beyond Successfully Detecting Adversarial Sentences in Text Classification	Feb 3, 2023	Adversarial AttackClassification	—Unverified
TF-Attack: Transferable and Fast Adversarial Attacks on Large Language Models	Aug 26, 2024	Adversarial Attack	—Unverified
The Attack Generator: A Systematic Approach Towards Constructing Adversarial Attacks	Jun 17, 2019	Adversarial AttackAdversarial Robustness	—Unverified
The Dark Side of Dynamic Routing Neural Networks: Towards Efficiency Backdoor Injection	Jan 1, 2023	Adversarial AttackDynamic neural networks	—Unverified
The Double-Edged Sword of Input Perturbations to Robust Accurate Fairness	Apr 1, 2024	Adversarial AttackFairness	—Unverified
THE EFFECT OF ADVERSARIAL TRAINING: A THEORETICAL CHARACTERIZATION	Sep 25, 2019	Adversarial Attack	—Unverified
The Effect of Similarity Measures on Accurate Stability Estimates for Local Surrogate Models in Text-based Explainable AI	Jun 22, 2024	Adversarial Attack	—Unverified
The Efficacy of SHIELD under Different Threat Models	Feb 1, 2019	Adversarial Attackimage-classification	—Unverified

Show:10 25 50

← PrevPage 44 of 73Next →

All datasets CIFAR-10 CIFAR-100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Xu et al.	Attack: PGD20	78.68	—	Unverified
2	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	78.13	—	Unverified
3	TRADES-ANCRA/ResNet18	Attack: AutoAttack	59.7	—	Unverified
4	AdvTraining [madry2018]	Attack: PGD20	48.44	—	Unverified
5	TRADES [zhang2019b]	Attack: PGD20	45.9	—	Unverified
6	XU-Net	Robust Accuracy	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	51.28	—	Unverified
2	multi-resolution self-ensembles	Attack: AutoAttack	47.85	—	Unverified