Adversarial Attack

An Adversarial Attack is a technique to find a perturbation that changes the prediction of a machine learning model. The perturbation can be very small and imperceptible to human eyes.

Source: Recurrent Attention Model with Log-Polar Mapping is Robust against Adversarial Attacks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 1808 papers

Title	Date	Tasks	Status	Hype
Robustness-aware Automatic Prompt Optimization	Dec 24, 2024	Adversarial Attack	CodeCode Available	0
Retention Score: Quantifying Jailbreak Risks for Vision Language Models	Dec 23, 2024	Adversarial Attack	—Unverified	0
Preventing Non-intrusive Load Monitoring Privacy Invasion: A Precise Adversarial Attack Scheme for Networked Smart Meters	Dec 22, 2024	Adversarial AttackNon-Intrusive Load Monitoring	—Unverified	0
ErasableMask: A Robust and Erasable Privacy Protection Scheme against Black-box Face Recognition Models	Dec 22, 2024	Adversarial AttackFace Recognition	—Unverified	0
PB-UAP: Hybrid Universal Adversarial Attack For Image Segmentation	Dec 21, 2024	Adversarial Attackimage-classification	—Unverified	0
Adversarial Attack Against Images Classification based on Generative Adversarial Networks	Dec 21, 2024	Adversarial AttackDecision Making	—Unverified	0
Adversarial Robustness through Dynamic Ensemble Learning	Dec 20, 2024	Adversarial AttackAdversarial Robustness	—Unverified	0
Watertox: The Art of Simplicity in Universal Attacks A Cross-Model Framework for Robust Adversarial Generation	Dec 20, 2024	Adversarial AttackDiversity	—Unverified	0
Physics-Based Adversarial Attack on Near-Infrared Human Detector for Nighttime Surveillance Camera Systems	Dec 18, 2024	Adversarial Attack	CodeCode Available	1
Human-in-the-Loop Generation of Adversarial Texts: A Case Study on Tibetan Script	Dec 17, 2024	Adversarial AttackAdversarial Robustness	CodeCode Available	1
Adversarially robust generalization theory via Jacobian regularization for deep neural networks	Dec 17, 2024	Adversarial Attack	—Unverified	0
Unpacking the Resilience of SNLI Contradiction Examples to Attacks	Dec 15, 2024	Adversarial Attack	CodeCode Available	0
RAT: Adversarial Attacks on Deep Reinforcement Agents for Targeted Behaviors	Dec 14, 2024	Adversarial AttackDeep Reinforcement Learning	—Unverified	0
A2RNet: Adversarial Attack Resilient Network for Robust Infrared and Visible Image Fusion	Dec 13, 2024	Adversarial AttackInfrared And Visible Image Fusion	CodeCode Available	1
Adversarial Vulnerabilities in Large Language Models for Time Series Forecasting	Dec 11, 2024	Adversarial AttackTime Series	CodeCode Available	1
Exploiting the Index Gradients for Optimization-Based Jailbreaking on Large Language Models	Dec 11, 2024	Adversarial Attack	CodeCode Available	1
AHSG: Adversarial Attack on High-level Semantics in Graph Neural Networks	Dec 10, 2024	Adversarial AttackGraph Learning	—Unverified	0
A Generative Victim Model for Segmentation	Dec 10, 2024	Adversarial AttackImage Generation	—Unverified	0
Take Fake as Real: Realistic-like Robust Black-box Adversarial Attack to Evade AIGC Detection	Dec 9, 2024	Adversarial Attack	—Unverified	0
From Flexibility to Manipulation: The Slippery Slope of XAI Evaluation	Dec 7, 2024	Adversarial AttackExplainable artificial intelligence	CodeCode Available	0
Less is More: A Stealthy and Efficient Adversarial Attack Method for DRL-based Autonomous Driving Policies	Dec 4, 2024	Adversarial AttackAutonomous Driving	—Unverified	0
Does Safety Training of LLMs Generalize to Semantically Related Natural Prompts?	Dec 4, 2024	Adversarial Attack	—Unverified	0
Hijacking Vision-and-Language Navigation Agents with Adversarial Environmental Attacks	Dec 3, 2024	Adversarial AttackVision and Language Navigation	—Unverified	0
Pay Attention to the Robustness of Chinese Minority Language Models! Syllable-level Textual Adversarial Attack on Tibetan Script	Dec 3, 2024	Adversarial Attack	CodeCode Available	0
Multi-Granularity Tibetan Textual Adversarial Attack Method Based on Masked Language Model	Dec 3, 2024	Adversarial AttackHate Speech Detection	CodeCode Available	0
Hiding Faces in Plain Sight: Defending DeepFakes by Disrupting Face Detection	Dec 2, 2024	Adversarial AttackFace Detection	CodeCode Available	1
Intermediate Outputs Are More Sensitive Than You Think	Dec 1, 2024	Adversarial AttackSensitivity	—Unverified	0
Fall Leaf Adversarial Attack on Traffic Sign Classification	Nov 27, 2024	Adversarial AttackClassification	—Unverified	0
Visual Adversarial Attack on Vision-Language Models for Autonomous Driving	Nov 27, 2024	Adversarial AttackAutonomous Driving	—Unverified	0
Scaling Laws for Black box Adversarial Attacks	Nov 25, 2024	Adversarial Attack	—Unverified	0
Privacy Protection in Personalized Diffusion Models via Targeted Cross-Attention Adversarial Attack	Nov 25, 2024	Adversarial Attack	—Unverified	0
Improving the Transferability of Adversarial Attacks on Face Recognition with Diverse Parameters Augmentation	Nov 23, 2024	Adversarial AttackFace Recognition	—Unverified	0
Evaluating the Robustness of the "Ensemble Everything Everywhere" Defense	Nov 22, 2024	Adversarial AttackRobust classification	—Unverified	0
NMT-Obfuscator Attack: Ignore a sentence in translation with only one word	Nov 19, 2024	Adversarial AttackAdversarial Text	CodeCode Available	0
DeTrigger: A Gradient-Centric Approach to Backdoor Attack Mitigation in Federated Learning	Nov 19, 2024	Adversarial AttackBackdoor Attack	—Unverified	0
BEARD: Benchmarking the Adversarial Robustness for Dataset Distillation	Nov 14, 2024	Adversarial AttackAdversarial Robustness	CodeCode Available	0
Robust Optimal Power Flow Against Adversarial Attacks: A Tri-Level Optimization Approach	Nov 13, 2024	Adversarial Attack	—Unverified	0
Chain Association-based Attacking and Shielding Natural Language Processing Systems	Nov 12, 2024	Adversarial Attack	—Unverified	0
Seeing is Deceiving: Exploitation of Visual Pathways in Multi-Modal Language Models	Nov 7, 2024	Adversarial AttackImage Captioning	—Unverified	0
Attention Masks Help Adversarial Attacks to Bypass Safety Detectors	Nov 7, 2024	Adversarial Attackimage-classification	CodeCode Available	0
Neural Fingerprints for Adversarial Attack Detection	Nov 7, 2024	Adversarial AttackAdversarial Attack Detection	CodeCode Available	0
Query-Efficient Adversarial Attack Against Vertical Federated Graph Learning	Nov 5, 2024	Adversarial AttackFederated Learning	CodeCode Available	0
Semantic-Aligned Adversarial Evolution Triangle for High-Transferability Vision-Language Attack	Nov 4, 2024	Adversarial AttackDiversity	CodeCode Available	1
LiDAttack: Robust Black-box Attack on LiDAR-based Object Detection	Nov 4, 2024	Adversarial Attackobject-detection	CodeCode Available	0
Replace-then-Perturb: Targeted Adversarial Attacks With Visual Reasoning for Vision-Language Models	Nov 1, 2024	Adversarial AttackContrastive Learning	—Unverified	0
Pseudo-Conversation Injection for LLM Goal Hijacking	Oct 31, 2024	Adversarial Attack	—Unverified	0
Keep on Swimming: Real Attackers Only Need Partial Knowledge of a Multi-Model System	Oct 30, 2024	Adversarial Attack	—Unverified	0
Automated Trustworthiness Oracle Generation for Machine Learning Text Classifiers	Oct 30, 2024	Adversarial AttackChatbot	—Unverified	0
Evaluating the Robustness of LiDAR Point Cloud Tracking Against Adversarial Attack	Oct 28, 2024	3D Object TrackingAdversarial Attack	—Unverified	0
Generative Adversarial Patches for Physical Attacks on Cross-Modal Pedestrian Re-Identification	Oct 26, 2024	Adversarial Attack	—Unverified	0

Show:10 25 50

← PrevPage 4 of 37Next →

All datasets CIFAR-10 CIFAR-100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Xu et al.	Attack: PGD20	78.68	—	Unverified
2	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	78.13	—	Unverified
3	TRADES-ANCRA/ResNet18	Attack: AutoAttack	59.7	—	Unverified
4	AdvTraining [madry2018]	Attack: PGD20	48.44	—	Unverified
5	TRADES [zhang2019b]	Attack: PGD20	45.9	—	Unverified
6	XU-Net	Robust Accuracy	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	51.28	—	Unverified
2	multi-resolution self-ensembles	Attack: AutoAttack	47.85	—	Unverified