Adversarial Attack

An Adversarial Attack is a technique to find a perturbation that changes the prediction of a machine learning model. The perturbation can be very small and imperceptible to human eyes.

Source: Recurrent Attention Model with Log-Polar Mapping is Robust against Adversarial Attacks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 1808 papers

Title	Date	Tasks	Status	Hype
Towards Robust and Secure Embodied AI: A Survey on Vulnerabilities and Attacks	Feb 18, 2025	Adversarial AttackAutonomous Vehicles	—Unverified	0
PAR-AdvGAN: Improving Adversarial Attack Capability with Progressive Auto-Regression AdvGAN	Feb 16, 2025	Adversarial Attackregression	—Unverified	0
To Think or Not to Think: Exploring the Unthinking Vulnerability in Large Reasoning Models	Feb 16, 2025	Adversarial AttackBackdoor Attack	CodeCode Available	1
ASVspoof 5: Design, Collection and Validation of Resources for Spoofing, Deepfake, and Adversarial Attack Detection Using Crowdsourced Speech	Feb 13, 2025	Adversarial AttackAdversarial Attack Detection	—Unverified	0
AdvSwap: Covert Adversarial Perturbation with High Frequency Info-swapping for Autonomous Driving Perception	Feb 12, 2025	Adversarial AttackAutonomous Driving	—Unverified	0
MAA: Meticulous Adversarial Attack against Vision-Language Pre-trained Models	Feb 12, 2025	Adversarial Attack	—Unverified	0
Universal Adversarial Attack on Aligned Multimodal LLMs	Feb 11, 2025	Adversarial Attack	—Unverified	0
Democratic Training Against Universal Adversarial Perturbations	Feb 8, 2025	Adversarial Attack	—Unverified	0
Rigid Body Adversarial Attacks	Feb 8, 2025	Adversarial Attack	—Unverified	0
BitAbuse: A Dataset of Visually Perturbed Texts for Defending Phishing Attacks	Feb 6, 2025	Adversarial Attack	CodeCode Available	0
MARAGE: Transferable Multi-Model Adversarial Attack for Retrieval-Augmented Generation Data Extraction	Feb 5, 2025	Adversarial AttackRAG	—Unverified	0
Real-Time Privacy Risk Measurement with Privacy Tokens for Gradient Leakage	Feb 5, 2025	Adversarial Attack	—Unverified	0
Wolfpack Adversarial Attack for Robust Multi-Agent Reinforcement Learning	Feb 5, 2025	Adversarial AttackMulti-agent Reinforcement Learning	CodeCode Available	0
CoRPA: Adversarial Image Generation for Chest X-rays Using Concept Vector Perturbations and Generative Models	Feb 4, 2025	Adversarial AttackDiagnostic	—Unverified	0
FRAUD-RLA: A new reinforcement learning adversarial attack against credit card fraud detection	Feb 4, 2025	Adversarial AttackFraud Detection	—Unverified	0
Refining Adaptive Zeroth-Order Optimization at Ease	Feb 3, 2025	Adversarial Attack	—Unverified	0
Adversarial Attacks on AI-Generated Text Detection Models: A Token Probability-Based Approach Using Embeddings	Jan 31, 2025	Adversarial AttackText Detection	—Unverified	0
Redefining Machine Unlearning: A Conformal Prediction-Motivated Approach	Jan 31, 2025	Adversarial AttackConformal Prediction	—Unverified	0
Understanding Oversmoothing in GNNs as Consensus in Opinion Dynamics	Jan 31, 2025	Adversarial Attack	—Unverified	0
SAeUron: Interpretable Concept Unlearning in Diffusion Models with Sparse Autoencoders	Jan 29, 2025	Adversarial AttackDenoising	CodeCode Available	2
HateBench: Benchmarking Hate Speech Detectors on LLM-Generated Content and Hate Campaigns	Jan 28, 2025	Adversarial AttackBenchmarking	CodeCode Available	1
The Relationship Between Network Similarity and Transferability of Adversarial Attacks	Jan 27, 2025	Adversarial Attack	—Unverified	0
GreedyPixel: Fine-Grained Black-Box Adversarial Attack Via Greedy Algorithm	Jan 24, 2025	Adversarial AttackComputational Efficiency	—Unverified	0
Device-aware Optical Adversarial Attack for a Portable Projector-camera System	Jan 23, 2025	Adversarial AttackFace Recognition	—Unverified	0
Black-Box Adversarial Attack on Vision Language Models for Autonomous Driving	Jan 23, 2025	Adversarial AttackAutonomous Driving	—Unverified	0
Heterogeneous Multi-Player Multi-Armed Bandits Robust To Adversarial Attacks	Jan 21, 2025	Adversarial AttackAll	—Unverified	0
Robustness of Selected Learning Models under Label-Flipping Attack	Jan 21, 2025	Adversarial Attack	—Unverified	0
Enhancing Adversarial Transferability via Component-Wise Transformation	Jan 21, 2025	Adversarial Attack	—Unverified	0
Differentiable Adversarial Attacks for Marked Temporal Point Processes	Jan 17, 2025	Adversarial AttackPoint Processes	CodeCode Available	0
Salient Information Preserving Adversarial Training Improves Clean and Robust Accuracy	Jan 15, 2025	Adversarial Attack	—Unverified	0
MOS-Attack: A Scalable Multi-objective Adversarial Attack Framework	Jan 13, 2025	Adversarial Attack	—Unverified	0
Protego: Detecting Adversarial Examples for Vision Transformers via Intrinsic Capabilities	Jan 13, 2025	Adversarial Attack	—Unverified	0
Effective faking of verbal deception detection with target-aligned adversarial attacks	Jan 10, 2025	Adversarial AttackDeception Detection	—Unverified	0
Enforcing Fundamental Relations via Adversarial Attacks on Input Parameter Correlations	Jan 9, 2025	Activity RecognitionAdversarial Attack	—Unverified	0
Rethinking Adversarial Attacks in Reinforcement Learning from Policy Distribution Perspective	Jan 7, 2025	Adversarial AttackDeep Reinforcement Learning	—Unverified	0
FlippedRAG: Black-Box Opinion Manipulation Adversarial Attacks to Retrieval-Augmented Generation Models	Jan 6, 2025	Adversarial AttackHallucination	—Unverified	0
Distillation-Enhanced Physical Adversarial Attacks	Jan 4, 2025	Adversarial AttackKnowledge Distillation	—Unverified	0
Adaptive Meta-learning-based Adversarial Training for Robust Automatic Modulation Classification	Jan 3, 2025	Adversarial AttackMeta-Learning	—Unverified	0
AVTrustBench: Assessing and Enhancing Reliability and Robustness in Audio-Visual LLMs	Jan 3, 2025	Adversarial AttackDiagnostic	—Unverified	0
Image-based Multimodal Models as Intruders: Transferable Multimodal Attacks on Video-based MLLMs	Jan 2, 2025	Adversarial AttackAttribute	—Unverified	0
Enhancing Adversarial Transferability with Checkpoints of a Single Model's Training	Jan 1, 2025	Adversarial AttackDiversity	—Unverified	0
I2VGuard: Safeguarding Images against Misuse in Diffusion-based Image-to-Video Models	Jan 1, 2025	Adversarial AttackImage to Video Generation	—Unverified	0
Advancing Adversarial Robustness in GNeRFs: The IL2-NeRF Attack	Jan 1, 2025	3D ReconstructionAdversarial Attack	CodeCode Available	0
Prompt2Perturb (P2P): Text-Guided Diffusion-Based Adversarial Attack on Breast Ultrasound Images	Jan 1, 2025	Adversarial AttackPrompt Learning	—Unverified	0
ProjAttacker: A Configurable Physical Adversarial Attack for Face Recognition via Projector	Jan 1, 2025	Adversarial AttackFace Recognition	—Unverified	0
Adversarial Attack and Defense for LoRa Device Identification and Authentication via Deep Learning	Dec 30, 2024	Adversarial AttackDensity Estimation	—Unverified	0
Adversarial Robustness for Deep Learning-based Wildfire Prediction Models	Dec 28, 2024	Adversarial AttackAdversarial Robustness	—Unverified	0
Attribution for Enhanced Explanation with Transferable Adversarial eXploration	Dec 27, 2024	Adversarial AttackDiversity	—Unverified	0
Robustness-aware Automatic Prompt Optimization	Dec 24, 2024	Adversarial Attack	CodeCode Available	0
An Empirical Analysis of Federated Learning Models Subject to Label-Flipping Adversarial Attack	Dec 24, 2024	Adversarial AttackFederated Learning	—Unverified	0

Show:10 25 50

← PrevPage 3 of 37Next →

All datasets CIFAR-10 CIFAR-100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	Xu et al.	Attack: PGD20	78.68	—	Unverified
2	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	78.13	—	Unverified
3	TRADES-ANCRA/ResNet18	Attack: AutoAttack	59.7	—	Unverified
4	AdvTraining [madry2018]	Attack: PGD20	48.44	—	Unverified
5	TRADES [zhang2019b]	Attack: PGD20	45.9	—	Unverified
6	XU-Net	Robust Accuracy	1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3-ensemble of multi-resolution self-ensembles	Attack: AutoAttack	51.28	—	Unverified
2	multi-resolution self-ensembles	Attack: AutoAttack	47.85	—	Unverified