SOTAVerified|Agents Browse Leaderboard About

Adversarial Attack

An Adversarial Attack is a technique to find a perturbation that changes the prediction of a machine learning model. The perturbation can be very small and imperceptible to human eyes.

Source: Recurrent Attention Model with Log-Polar Mapping is Robust against Adversarial Attacks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 341–350 of 1808 papers

Title	Date	Tasks	Status	Hype
Counterfactual Explanations for Face Forgery Detection via Adversarial Removal of Artifacts	Apr 12, 2024	Adversarial Attackcounterfactual	CodeCode Available	0
Towards Building a Robust Toxicity Predictor	Apr 9, 2024	Adversarial Attack	—Unverified	0
BruSLeAttack: A Query-Efficient Score-Based Black-Box Sparse Adversarial Attack	Apr 8, 2024	Adversarial Attack	—Unverified	0
Adversarial Attacks and Dimensionality in Text Classifiers	Apr 3, 2024	Adversarial AttackAdversarial Defense	—Unverified	0
Jailbreaking Prompt Attack: A Controllable Adversarial Attack against Diffusion Models	Apr 2, 2024	Adversarial AttackImage Generation	—Unverified	0
READ: Improving Relation Extraction from an ADversarial Perspective	Apr 2, 2024	Adversarial AttackRelation	CodeCode Available	0
Multi-granular Adversarial Attacks against Black-box Neural Ranking Models	Apr 2, 2024	Adversarial AttackDecision Making	—Unverified	0
Patch Synthesis for Property Repair of Deep Neural Networks	Apr 2, 2024	Adversarial Attack	—Unverified	0
Humanizing Machine-Generated Content: Evading AI-Text Detection through Adversarial Attack	Apr 2, 2024	Adversarial AttackText Detection	CodeCode Available	2
The Double-Edged Sword of Input Perturbations to Robust Accurate Fairness	Apr 1, 2024	Adversarial AttackFairness	—Unverified	0

Show:10 25 50

← PrevPage 35 of 181Next →

All datasets CIFAR-10 CIFAR-100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Xu et al.	Attack: PGD20	78.68	—	Unverified
2	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	78.13	—	Unverified
3	TRADES-ANCRA/ResNet18	Attack: AutoAttack	59.7	—	Unverified
4	AdvTraining [madry2018]	Attack: PGD20	48.44	—	Unverified
5	TRADES [zhang2019b]	Attack: PGD20	45.9	—	Unverified
6	XU-Net	Robust Accuracy	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	51.28	—	Unverified
2	multi-resolution self-ensembles	Attack: AutoAttack	47.85	—	Unverified