Adversarial Attack

An Adversarial Attack is a technique to find a perturbation that changes the prediction of a machine learning model. The perturbation can be very small and imperceptible to human eyes.

Source: Recurrent Attention Model with Log-Polar Mapping is Robust against Adversarial Attacks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 1808 papers

Title	Date	Tasks	Status	Hype
Towards Benchmarking and Assessing the Safety and Robustness of Autonomous Driving on Safety-critical Scenarios	Mar 31, 2025	Adversarial AttackAutonomous Driving	—Unverified	0
Robust Deep Reinforcement Learning in Robotics via Adaptive Gradient-Masked Adversarial Attacks	Mar 26, 2025	Adversarial AttackAdversarial Defense	—Unverified	0
State-Aware Perturbation Optimization for Robust Deep Reinforcement Learning	Mar 26, 2025	Adversarial AttackDeep Reinforcement Learning	—Unverified	0
sudo rm -rf agentic_security	Mar 26, 2025	Adversarial AttackAI and Safety	CodeCode Available	1
ImF: Implicit Fingerprint for Large Language Models	Mar 25, 2025	Adversarial AttackQuestion Answering	—Unverified	0
Bitstream Collisions in Neural Image Compression via Adversarial Perturbations	Mar 25, 2025	Adversarial AttackImage Compression	CodeCode Available	0
Make the Most of Everything: Further Considerations on Disrupting Diffusion-based Customization	Mar 18, 2025	Adversarial Attack	—Unverified	0
Augmented Adversarial Trigger Learning	Mar 16, 2025	Adversarial Attack	—Unverified	0
CyberLLMInstruct: A New Dataset for Analysing Safety of Fine-Tuned LLMs Using Cyber Security Data	Mar 12, 2025	Adversarial AttackMalware Analysis	CodeCode Available	1
ReLATE: Resilient Learner Selection for Multivariate Time-Series Classification Against Adversarial Attacks	Mar 10, 2025	Adversarial AttackDeep Learning	—Unverified	0
Scale-Invariant Adversarial Attack against Arbitrary-scale Super-resolution	Mar 6, 2025	Adversarial AttackSuper-Resolution	—Unverified	0
Towards Effective and Sparse Adversarial Attack on Spiking Neural Networks via Breaking Invisible Surrogate Gradients	Mar 5, 2025	Adversarial Attack	CodeCode Available	0
Decoder Gradient Shield: Provable and High-Fidelity Prevention of Gradient-Based Box-Free Watermark Removal	Feb 28, 2025	Adversarial AttackDecoder	—Unverified	0
Data-free Universal Adversarial Perturbation with Pseudo-semantic Prior	Feb 28, 2025	Adversarial Attack	CodeCode Available	1
QFAL: Quantum Federated Adversarial Learning	Feb 28, 2025	Adversarial AttackFederated Learning	—Unverified	0
Prompt-driven Transferable Adversarial Attack on Person Re-Identification with Attribute-aware Textual Inversion	Feb 27, 2025	Adversarial AttackAttribute	—Unverified	0
Snowball Adversarial Attack on Traffic Sign Classification	Feb 27, 2025	Adversarial AttackClassification	—Unverified	0
XSS Adversarial Attacks Based on Deep Reinforcement Learning: A Replication and Extension Study	Feb 26, 2025	Adversarial AttackDeep Reinforcement Learning	CodeCode Available	0
Improving the Transferability of Adversarial Examples by Inverse Knowledge Distillation	Feb 24, 2025	Adversarial AttackDiversity	—Unverified	0
VGFL-SA: Vertical Graph Federated Learning Structure Attack Based on Contrastive Learning	Feb 24, 2025	Adversarial AttackContrastive Learning	—Unverified	0
Emoti-Attack: Zero-Perturbation Adversarial Attacks on NLP Systems via Emoji Sequences	Feb 24, 2025	Adversarial AttackAdversarial Robustness	—Unverified	0
Tracking the Copyright of Large Vision-Language Models through Parameter Learning Adversarial Images	Feb 23, 2025	Adversarial AttackQuestion Answering	—Unverified	0
A Multi-Scale Isolation Forest Approach for Real-Time Detection and Filtering of FGSM Adversarial Attacks in Video Streams of Autonomous Vehicles	Feb 22, 2025	Adversarial AttackAutonomous Vehicles	—Unverified	0
Moshi Moshi? A Model Selection Hijacking Adversarial Attack	Feb 20, 2025	Adversarial AttackComputational Efficiency	—Unverified	0
Iron Sharpens Iron: Defending Against Attacks in Machine-Generated Text Detection with Adversarial Training	Feb 18, 2025	Adversarial AttackText Detection	CodeCode Available	1

Show:10 25 50

← PrevPage 4 of 73Next →

All datasets CIFAR-10 CIFAR-100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Xu et al.	Attack: PGD20	78.68	—	Unverified
2	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	78.13	—	Unverified
3	TRADES-ANCRA/ResNet18	Attack: AutoAttack	59.7	—	Unverified
4	AdvTraining [madry2018]	Attack: PGD20	48.44	—	Unverified
5	TRADES [zhang2019b]	Attack: PGD20	45.9	—	Unverified
6	XU-Net	Robust Accuracy	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	51.28	—	Unverified
2	multi-resolution self-ensembles	Attack: AutoAttack	47.85	—	Unverified