Adversarial Attack

An Adversarial Attack is a technique to find a perturbation that changes the prediction of a machine learning model. The perturbation can be very small and imperceptible to human eyes.

Source: Recurrent Attention Model with Log-Polar Mapping is Robust against Adversarial Attacks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 1808 papers

Title	Date	Tasks	Status	Hype
Uncertainty-Aware SAR ATR: Defending Against Adversarial Attacks via Bayesian Neural Networks	Mar 27, 2024	Adversarial AttackDecision Making	—Unverified	0
Deep Learning for Robust and Explainable Models in Computer Vision	Mar 27, 2024	Adversarial AttackDeep Learning	—Unverified	0
CosalPure: Learning Concept from Group Images for Robust Co-Saliency Detection	Mar 27, 2024	Adversarial AttackCo-Salient Object Detection	—Unverified	0
Physical 3D Adversarial Attacks against Monocular Depth Estimation in Autonomous Driving	Mar 26, 2024	Adversarial AttackAutonomous Driving	CodeCode Available	2
LinkPrompt: Natural and Universal Adversarial Attacks on Prompt-based Language Models	Mar 25, 2024	Adversarial AttackLanguage Modeling	CodeCode Available	0
Diffusion Attack: Leveraging Stable Diffusion for Naturalistic Image Attacking	Mar 21, 2024	Adversarial AttackStyle Transfer	—Unverified	0
DD-RobustBench: An Adversarial Robustness Benchmark for Dataset Distillation	Mar 20, 2024	Adversarial AttackAdversarial Robustness	CodeCode Available	0
FMM-Attack: A Flow-based Multi-modal Adversarial Attack on Video-based LLMs	Mar 20, 2024	Adversarial Attack	CodeCode Available	0
Capsule Neural Networks as Noise Stabilizer for Time Series Data	Mar 20, 2024	Adversarial AttackTime Series	—Unverified	0
As Firm As Their Foundations: Can open-sourced foundation models be used to create adversarial examples for downstream tasks?	Mar 19, 2024	Adversarial AttackImage Captioning	—Unverified	0
SSCAE -- Semantic, Syntactic, and Context-aware natural language Adversarial Examples generator	Mar 18, 2024	Adversarial AttackLanguage Modelling	—Unverified	0
LocalStyleFool: Regional Video Style Transfer Attack Using Segment Anything Model	Mar 18, 2024	Adversarial AttackStyle Transfer	—Unverified	0
Robust Overfitting Does Matter: Test-Time Adversarial Purification With FGSM	Mar 18, 2024	Adversarial AttackAdversarial Defense	CodeCode Available	0
A Modified Word Saliency-Based Adversarial Attack on Text Classification Models	Mar 17, 2024	Adversarial AttackClassification	—Unverified	0
Benchmarking Adversarial Robustness of Image Shadow Removal with Shadow-adaptive Attacks	Mar 15, 2024	Adversarial AttackAdversarial Robustness	—Unverified	0
Fast Inference of Removal-Based Node Influence	Mar 13, 2024	Adversarial Attackcounterfactual	CodeCode Available	0
Attack Deterministic Conditional Image Generative Models for Diverse and Controllable Generation	Mar 13, 2024	Adversarial AttackConditional Image Generation	—Unverified	0
epsilon-Mesh Attack: A Surface-based Adversarial Point Cloud Attack for Facial Expression Recognition	Mar 11, 2024	Adversarial AttackFacial Expression Recognition	CodeCode Available	1
IOI: Invisible One-Iteration Adversarial Attack on No-Reference Image- and Video-Quality Metrics	Mar 9, 2024	Adversarial Attack	CodeCode Available	0
Hard-label based Small Query Black-box Adversarial Attack	Mar 9, 2024	Adversarial Attack	CodeCode Available	0
Prepared for the Worst: A Learning-Based Adversarial Attack for Resilience Analysis of the ICP Algorithm	Mar 8, 2024	Adversarial AttackAutonomous Navigation	—Unverified	0
Hide in Thicket: Generating Imperceptible and Rational Adversarial Perturbations on 3D Point Clouds	Mar 8, 2024	3D Point Cloud ClassificationAdversarial Attack	CodeCode Available	1
Adversarial Infrared Geometry: Using Geometry to Perform Adversarial Attack against Infrared Pedestrian Detectors	Mar 6, 2024	Adversarial AttackAdversarial Defense	—Unverified	0
One Prompt Word is Enough to Boost Adversarial Robustness for Pre-trained Vision-Language Models	Mar 4, 2024	Adversarial AttackAdversarial Robustness	CodeCode Available	2
SAR-AE-SFP: SAR Imagery Adversarial Example in Real Physics domain with Target Scattering Feature Parameters	Mar 2, 2024	Adversarial Attack	—Unverified	0
Robust Deep Reinforcement Learning Through Adversarial Attacks and Training : A Survey	Mar 1, 2024	Adversarial AttackDeep Reinforcement Learning	—Unverified	0
Unraveling Adversarial Examples against Speaker Identification -- Techniques for Attack Detection and Victim Model Classification	Feb 29, 2024	Adversarial AttackClassification	—Unverified	0
Enhancing Tracking Robustness with Auxiliary Adversarial Defense Networks	Feb 28, 2024	Adversarial AttackAdversarial Defense	—Unverified	0
Conformal Shield: A Novel Adversarial Attack Detection Framework for Automatic Modulation Classification	Feb 27, 2024	Adversarial AttackAdversarial Attack Detection	—Unverified	0
Extreme Miscalibration and the Illusion of Adversarial Robustness	Feb 27, 2024	Adversarial AttackAdversarial Robustness	—Unverified	0
Improving the JPEG-resistance of Adversarial Attacks on Face Recognition by Interpolation Smoothing	Feb 26, 2024	Adversarial AttackFace Recognition	—Unverified	0
RAUCA: A Novel Physical Adversarial Attack on Vehicle Detectors via Robust and Accurate Camouflage Generation	Feb 24, 2024	Adversarial AttackNeural Rendering	CodeCode Available	1
LLMs Can Defend Themselves Against Jailbreaking in a Practical Manner: A Vision Paper	Feb 24, 2024	Adversarial AttackSafety Alignment	—Unverified	0
Fast Adversarial Attacks on Language Models In One GPU Minute	Feb 23, 2024	Adversarial AttackComputational Efficiency	CodeCode Available	2
Noise-BERT: A Unified Perturbation-Robust Framework with Noise Alignment Pre-training for Noisy Slot Filling Task	Feb 22, 2024	Adversarial AttackContrastive Learning	—Unverified	0
Beyond Worst-case Attacks: Robust RL with Adaptive Defense via Non-dominated Policies	Feb 20, 2024	Adversarial AttackMuJoCo	CodeCode Available	0
An Adversarial Approach to Evaluating the Robustness of Event Identification Models	Feb 19, 2024	Adversarial AttackClassification	—Unverified	0
AICAttack: Adversarial Image Captioning Attack with Attention-Based Optimization	Feb 19, 2024	Adversarial AttackImage Captioning	CodeCode Available	0
Only My Model On My Data: A Privacy Preserving Approach Protecting one Model and Deceiving Unauthorized Black-Box Models	Feb 14, 2024	Adversarial AttackClassification	—Unverified	0
Accuracy of TextFooler black box adversarial attacks on 01 loss sign activation neural network ensemble	Feb 12, 2024	Adversarial AttackClassification	CodeCode Available	0
Corruption Robust Offline Reinforcement Learning with Human Feedback	Feb 9, 2024	Adversarial Attackreinforcement-learning	—Unverified	0
TETRIS: Towards Exploring the Robustness of Interactive Segmentation	Feb 9, 2024	Adversarial AttackAdversarial Robustness	—Unverified	0
FoolSDEdit: Deceptively Steering Your Edits Towards Targeted Attribute-aware Distribution	Feb 6, 2024	Adversarial AttackAttribute	—Unverified	0
PROSAC: Provably Safe Certification for Machine Learning Models under Adversarial Attacks	Feb 4, 2024	Adversarial AttackBayesian Optimization	—Unverified	0
DeSparsify: Adversarial Attack Against Token Sparsification Mechanisms in Vision Transformers	Feb 4, 2024	Adversarial AttackGPU	CodeCode Available	0
Analyzing Sentiment Polarity Reduction in News Presentation through Contextual Perturbation and Large Language Models	Feb 3, 2024	Adversarial AttackLanguage Modeling	—Unverified	0
HQA-Attack: Toward High Quality Black-Box Hard-Label Adversarial Attack on Text	Feb 2, 2024	Adversarial AttackHard-label Attack	CodeCode Available	0
On the Multi-modal Vulnerability of Diffusion Models	Feb 2, 2024	Adversarial AttackImage Generation	CodeCode Available	1
SignSGD with Federated Defense: Harnessing Adversarial Attacks through Gradient Sign Decoding	Feb 2, 2024	Adversarial AttackQuantization	CodeCode Available	0
STAA-Net: A Sparse and Transferable Adversarial Attack for Speech Emotion Recognition	Feb 2, 2024	Adversarial AttackEmotion Recognition	—Unverified	0

Show:10 25 50

← PrevPage 8 of 37Next →

All datasets CIFAR-10 CIFAR-100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Xu et al.	Attack: PGD20	78.68	—	Unverified
2	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	78.13	—	Unverified
3	TRADES-ANCRA/ResNet18	Attack: AutoAttack	59.7	—	Unverified
4	AdvTraining [madry2018]	Attack: PGD20	48.44	—	Unverified
5	TRADES [zhang2019b]	Attack: PGD20	45.9	—	Unverified
6	XU-Net	Robust Accuracy	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	51.28	—	Unverified
2	multi-resolution self-ensembles	Attack: AutoAttack	47.85	—	Unverified