Adversarial Attack

An Adversarial Attack is a technique to find a perturbation that changes the prediction of a machine learning model. The perturbation can be very small and imperceptible to human eyes.

Source: Recurrent Attention Model with Log-Polar Mapping is Robust against Adversarial Attacks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 1808 papers

Title	Date	Tasks	Status	Hype
Towards Robust and Secure Embodied AI: A Survey on Vulnerabilities and Attacks	Feb 18, 2025	Adversarial AttackAutonomous Vehicles	—Unverified	0
PAR-AdvGAN: Improving Adversarial Attack Capability with Progressive Auto-Regression AdvGAN	Feb 16, 2025	Adversarial Attackregression	—Unverified	0
To Think or Not to Think: Exploring the Unthinking Vulnerability in Large Reasoning Models	Feb 16, 2025	Adversarial AttackBackdoor Attack	CodeCode Available	1
ASVspoof 5: Design, Collection and Validation of Resources for Spoofing, Deepfake, and Adversarial Attack Detection Using Crowdsourced Speech	Feb 13, 2025	Adversarial AttackAdversarial Attack Detection	—Unverified	0
AdvSwap: Covert Adversarial Perturbation with High Frequency Info-swapping for Autonomous Driving Perception	Feb 12, 2025	Adversarial AttackAutonomous Driving	—Unverified	0
MAA: Meticulous Adversarial Attack against Vision-Language Pre-trained Models	Feb 12, 2025	Adversarial Attack	—Unverified	0
Universal Adversarial Attack on Aligned Multimodal LLMs	Feb 11, 2025	Adversarial Attack	—Unverified	0
Democratic Training Against Universal Adversarial Perturbations	Feb 8, 2025	Adversarial Attack	—Unverified	0
Rigid Body Adversarial Attacks	Feb 8, 2025	Adversarial Attack	—Unverified	0
BitAbuse: A Dataset of Visually Perturbed Texts for Defending Phishing Attacks	Feb 6, 2025	Adversarial Attack	CodeCode Available	0
Real-Time Privacy Risk Measurement with Privacy Tokens for Gradient Leakage	Feb 5, 2025	Adversarial Attack	—Unverified	0
Wolfpack Adversarial Attack for Robust Multi-Agent Reinforcement Learning	Feb 5, 2025	Adversarial AttackMulti-agent Reinforcement Learning	CodeCode Available	0
MARAGE: Transferable Multi-Model Adversarial Attack for Retrieval-Augmented Generation Data Extraction	Feb 5, 2025	Adversarial AttackRAG	—Unverified	0
CoRPA: Adversarial Image Generation for Chest X-rays Using Concept Vector Perturbations and Generative Models	Feb 4, 2025	Adversarial AttackDiagnostic	—Unverified	0
FRAUD-RLA: A new reinforcement learning adversarial attack against credit card fraud detection	Feb 4, 2025	Adversarial AttackFraud Detection	—Unverified	0
Refining Adaptive Zeroth-Order Optimization at Ease	Feb 3, 2025	Adversarial Attack	—Unverified	0
Adversarial Attacks on AI-Generated Text Detection Models: A Token Probability-Based Approach Using Embeddings	Jan 31, 2025	Adversarial AttackText Detection	—Unverified	0
Redefining Machine Unlearning: A Conformal Prediction-Motivated Approach	Jan 31, 2025	Adversarial AttackConformal Prediction	—Unverified	0
Understanding Oversmoothing in GNNs as Consensus in Opinion Dynamics	Jan 31, 2025	Adversarial Attack	—Unverified	0
SAeUron: Interpretable Concept Unlearning in Diffusion Models with Sparse Autoencoders	Jan 29, 2025	Adversarial AttackDenoising	CodeCode Available	2
HateBench: Benchmarking Hate Speech Detectors on LLM-Generated Content and Hate Campaigns	Jan 28, 2025	Adversarial AttackBenchmarking	CodeCode Available	1
The Relationship Between Network Similarity and Transferability of Adversarial Attacks	Jan 27, 2025	Adversarial Attack	—Unverified	0
GreedyPixel: Fine-Grained Black-Box Adversarial Attack Via Greedy Algorithm	Jan 24, 2025	Adversarial AttackComputational Efficiency	—Unverified	0
Device-aware Optical Adversarial Attack for a Portable Projector-camera System	Jan 23, 2025	Adversarial AttackFace Recognition	—Unverified	0
Black-Box Adversarial Attack on Vision Language Models for Autonomous Driving	Jan 23, 2025	Adversarial AttackAutonomous Driving	—Unverified	0

Show:10 25 50

← PrevPage 5 of 73Next →

All datasets CIFAR-10 CIFAR-100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Xu et al.	Attack: PGD20	78.68	—	Unverified
2	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	78.13	—	Unverified
3	TRADES-ANCRA/ResNet18	Attack: AutoAttack	59.7	—	Unverified
4	AdvTraining [madry2018]	Attack: PGD20	48.44	—	Unverified
5	TRADES [zhang2019b]	Attack: PGD20	45.9	—	Unverified
6	XU-Net	Robust Accuracy	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	51.28	—	Unverified
2	multi-resolution self-ensembles	Attack: AutoAttack	47.85	—	Unverified