Adversarial Attack

An Adversarial Attack is a technique to find a perturbation that changes the prediction of a machine learning model. The perturbation can be very small and imperceptible to human eyes.

Source: Recurrent Attention Model with Log-Polar Mapping is Robust against Adversarial Attacks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 451–500 of 1808 papers

Title	Date	Tasks	Status
Adversarial Robustness for Deep Learning-based Wildfire Prediction Models	Dec 28, 2024	Adversarial AttackAdversarial Robustness	—Unverified
Attribution for Enhanced Explanation with Transferable Adversarial eXploration	Dec 27, 2024	Adversarial AttackDiversity	—Unverified
SurvAttack: Black-Box Attack On Survival Models through Ontology-Informed EHR Perturbation	Dec 24, 2024	Adversarial Attackcounterfactual	—Unverified
An Empirical Analysis of Federated Learning Models Subject to Label-Flipping Adversarial Attack	Dec 24, 2024	Adversarial AttackFederated Learning	—Unverified
Robustness-aware Automatic Prompt Optimization	Dec 24, 2024	Adversarial Attack	CodeCode Available
Retention Score: Quantifying Jailbreak Risks for Vision Language Models	Dec 23, 2024	Adversarial Attack	—Unverified
ErasableMask: A Robust and Erasable Privacy Protection Scheme against Black-box Face Recognition Models	Dec 22, 2024	Adversarial AttackFace Recognition	—Unverified
Preventing Non-intrusive Load Monitoring Privacy Invasion: A Precise Adversarial Attack Scheme for Networked Smart Meters	Dec 22, 2024	Adversarial AttackNon-Intrusive Load Monitoring	—Unverified
PB-UAP: Hybrid Universal Adversarial Attack For Image Segmentation	Dec 21, 2024	Adversarial Attackimage-classification	—Unverified
Adversarial Attack Against Images Classification based on Generative Adversarial Networks	Dec 21, 2024	Adversarial AttackDecision Making	—Unverified
Adversarial Robustness through Dynamic Ensemble Learning	Dec 20, 2024	Adversarial AttackAdversarial Robustness	—Unverified
Watertox: The Art of Simplicity in Universal Attacks A Cross-Model Framework for Robust Adversarial Generation	Dec 20, 2024	Adversarial AttackDiversity	—Unverified
Adversarially robust generalization theory via Jacobian regularization for deep neural networks	Dec 17, 2024	Adversarial Attack	—Unverified
Unpacking the Resilience of SNLI Contradiction Examples to Attacks	Dec 15, 2024	Adversarial Attack	CodeCode Available
RAT: Adversarial Attacks on Deep Reinforcement Agents for Targeted Behaviors	Dec 14, 2024	Adversarial AttackDeep Reinforcement Learning	—Unverified
AHSG: Adversarial Attack on High-level Semantics in Graph Neural Networks	Dec 10, 2024	Adversarial AttackGraph Learning	—Unverified
A Generative Victim Model for Segmentation	Dec 10, 2024	Adversarial AttackImage Generation	—Unverified
Take Fake as Real: Realistic-like Robust Black-box Adversarial Attack to Evade AIGC Detection	Dec 9, 2024	Adversarial Attack	—Unverified
From Flexibility to Manipulation: The Slippery Slope of XAI Evaluation	Dec 7, 2024	Adversarial AttackExplainable artificial intelligence	CodeCode Available
Less is More: A Stealthy and Efficient Adversarial Attack Method for DRL-based Autonomous Driving Policies	Dec 4, 2024	Adversarial AttackAutonomous Driving	—Unverified
Does Safety Training of LLMs Generalize to Semantically Related Natural Prompts?	Dec 4, 2024	Adversarial Attack	—Unverified
Multi-Granularity Tibetan Textual Adversarial Attack Method Based on Masked Language Model	Dec 3, 2024	Adversarial AttackHate Speech Detection	CodeCode Available
Pay Attention to the Robustness of Chinese Minority Language Models! Syllable-level Textual Adversarial Attack on Tibetan Script	Dec 3, 2024	Adversarial Attack	CodeCode Available
Hijacking Vision-and-Language Navigation Agents with Adversarial Environmental Attacks	Dec 3, 2024	Adversarial AttackVision and Language Navigation	—Unverified
Intermediate Outputs Are More Sensitive Than You Think	Dec 1, 2024	Adversarial AttackSensitivity	—Unverified
Fall Leaf Adversarial Attack on Traffic Sign Classification	Nov 27, 2024	Adversarial AttackClassification	—Unverified
Visual Adversarial Attack on Vision-Language Models for Autonomous Driving	Nov 27, 2024	Adversarial AttackAutonomous Driving	—Unverified
Privacy Protection in Personalized Diffusion Models via Targeted Cross-Attention Adversarial Attack	Nov 25, 2024	Adversarial Attack	—Unverified
Scaling Laws for Black box Adversarial Attacks	Nov 25, 2024	Adversarial Attack	—Unverified
Improving the Transferability of Adversarial Attacks on Face Recognition with Diverse Parameters Augmentation	Nov 23, 2024	Adversarial AttackFace Recognition	—Unverified
Evaluating the Robustness of the "Ensemble Everything Everywhere" Defense	Nov 22, 2024	Adversarial AttackRobust classification	—Unverified
NMT-Obfuscator Attack: Ignore a sentence in translation with only one word	Nov 19, 2024	Adversarial AttackAdversarial Text	CodeCode Available
DeTrigger: A Gradient-Centric Approach to Backdoor Attack Mitigation in Federated Learning	Nov 19, 2024	Adversarial AttackBackdoor Attack	—Unverified
BEARD: Benchmarking the Adversarial Robustness for Dataset Distillation	Nov 14, 2024	Adversarial AttackAdversarial Robustness	CodeCode Available
Robust Optimal Power Flow Against Adversarial Attacks: A Tri-Level Optimization Approach	Nov 13, 2024	Adversarial Attack	—Unverified
Chain Association-based Attacking and Shielding Natural Language Processing Systems	Nov 12, 2024	Adversarial Attack	—Unverified
Neural Fingerprints for Adversarial Attack Detection	Nov 7, 2024	Adversarial AttackAdversarial Attack Detection	CodeCode Available
Attention Masks Help Adversarial Attacks to Bypass Safety Detectors	Nov 7, 2024	Adversarial Attackimage-classification	CodeCode Available
Seeing is Deceiving: Exploitation of Visual Pathways in Multi-Modal Language Models	Nov 7, 2024	Adversarial AttackImage Captioning	—Unverified
Query-Efficient Adversarial Attack Against Vertical Federated Graph Learning	Nov 5, 2024	Adversarial AttackFederated Learning	CodeCode Available
LiDAttack: Robust Black-box Attack on LiDAR-based Object Detection	Nov 4, 2024	Adversarial Attackobject-detection	CodeCode Available
Replace-then-Perturb: Targeted Adversarial Attacks With Visual Reasoning for Vision-Language Models	Nov 1, 2024	Adversarial AttackContrastive Learning	—Unverified
Pseudo-Conversation Injection for LLM Goal Hijacking	Oct 31, 2024	Adversarial Attack	—Unverified
Keep on Swimming: Real Attackers Only Need Partial Knowledge of a Multi-Model System	Oct 30, 2024	Adversarial Attack	—Unverified
Automated Trustworthiness Oracle Generation for Machine Learning Text Classifiers	Oct 30, 2024	Adversarial AttackChatbot	—Unverified
Evaluating the Robustness of LiDAR Point Cloud Tracking Against Adversarial Attack	Oct 28, 2024	3D Object TrackingAdversarial Attack	—Unverified
Generative Adversarial Patches for Physical Attacks on Cross-Modal Pedestrian Re-Identification	Oct 26, 2024	Adversarial Attack	—Unverified
Adversarial Attacks on Large Language Models Using Regularized Relaxation	Oct 24, 2024	Adversarial Attackvalid	CodeCode Available
Backdoor in Seconds: Unlocking Vulnerabilities in Large Pre-trained Models via Model Editing	Oct 23, 2024	Adversarial AttackBackdoor Attack	—Unverified
Toward Robust RALMs: Revealing the Impact of Imperfect Retrieval on Retrieval-Augmented Language Models	Oct 19, 2024	Adversarial AttackAdversarial Robustness	CodeCode Available

Show:10 25 50

← PrevPage 10 of 37Next →

All datasets CIFAR-10 CIFAR-100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Xu et al.	Attack: PGD20	78.68	—	Unverified
2	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	78.13	—	Unverified
3	TRADES-ANCRA/ResNet18	Attack: AutoAttack	59.7	—	Unverified
4	AdvTraining [madry2018]	Attack: PGD20	48.44	—	Unverified
5	TRADES [zhang2019b]	Attack: PGD20	45.9	—	Unverified
6	XU-Net	Robust Accuracy	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	51.28	—	Unverified
2	multi-resolution self-ensembles	Attack: AutoAttack	47.85	—	Unverified