Adversarial Robustness

Adversarial Robustness evaluates the vulnerabilities of machine learning models under various types of adversarial attacks.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 1746 papers

Title	Date	Tasks	Status	Hype
Bridging Robustness and Generalization Against Word Substitution Attacks in NLP via the Growth Bound Matrix Approach	Jul 14, 2025	Adversarial DefenseAdversarial Robustness	CodeCode Available	0
Tail-aware Adversarial Attacks: A Distributional Approach to Efficient LLM Jailbreaking	Jul 6, 2025	Adversarial Robustness	—Unverified	0
Rectifying Adversarial Sample with Low Entropy Prior for Test-Time Defense	Jul 4, 2025	Adversarial Robustness	—Unverified	0
Evaluating the Evaluators: Trust in Adversarial Robustness Tests	Jul 4, 2025	Adversarial Robustness	—Unverified	0
Is Reasoning All You Need? Probing Bias in the Age of Reasoning Language Models	Jul 3, 2025	Adversarial RobustnessAll	—Unverified	0
NIC-RobustBench: A Comprehensive Open-Source Toolkit for Neural Image Compression and Robustness Analysis	Jun 23, 2025	Adversarial RobustnessImage Compression	CodeCode Available	1
PRISON: Unmasking the Criminal Potential of Large Language Models	Jun 19, 2025	Adversarial Robustness	—Unverified	0
Intriguing Frequency Interpretation of Adversarial Robustness for CNNs and ViTs	Jun 15, 2025	Adversarial Robustnessimage-classification	—Unverified	0
NAP-Tuning: Neural Augmented Prompt Tuning for Adversarially Robust Vision-Language Models	Jun 15, 2025	Adversarial Robustness	—Unverified	0
Canonical Latent Representations in Conditional Diffusion Models	Jun 11, 2025	Adversarial RobustnessRepresentation Learning	—Unverified	0
PatchGuard: Adversarially Robust Anomaly Detection and Localization through Vision Transformers and Pseudo Anomalies	Jun 10, 2025	Adversarial RobustnessAnomaly Detection	CodeCode Available	1
Towards Class-wise Fair Adversarial Training via Anti-Bias Soft Label Distillation	Jun 10, 2025	Adversarial RobustnessFairness	CodeCode Available	0
The interplay of robustness and generalization in quantum machine learning	Jun 10, 2025	Adversarial RobustnessQuantum Machine Learning	CodeCode Available	0
Enhancing Adversarial Robustness with Conformal Prediction: A Framework for Guaranteed Model Reliability	Jun 9, 2025	Adversarial AttackAdversarial Robustness	CodeCode Available	0
ProARD: progressive adversarial robustness distillation: provide wide range of robust students	Jun 9, 2025	Adversarial Robustness	CodeCode Available	0
Sylva: Tailoring Personalized Adversarial Defense in Pre-trained Models via Collaborative Fine-tuning	Jun 4, 2025	Adversarial DefenseAdversarial Robustness	—Unverified	0
RAID: A Dataset for Testing the Adversarial Robustness of AI-Generated Image Detectors	Jun 4, 2025	Adversarial Robustness	CodeCode Available	0
Dynamic Epsilon Scheduling: A Multi-Factor Adaptive Perturbation Budget for Adversarial Training	Jun 3, 2025	Adversarial RobustnessScheduling	—Unverified	0
Speech Unlearning	Jun 1, 2025	Adversarial RobustnessKeyword Spotting	—Unverified	0
SafeGenes: Evaluating the Adversarial Robustness of Genomic Foundation Models	Jun 1, 2025	Adversarial Robustness	—Unverified	0
A Flat Minima Perspective on Understanding Augmentations and Model Robustness	May 30, 2025	Adversarial RobustnessData Augmentation	—Unverified	0
The Butterfly Effect in Pathology: Exploring Security in Pathology Foundation Models	May 30, 2025	Adversarial Robustness	CodeCode Available	0
On the Scaling of Robustness and Effectiveness in Dense Retrieval	May 30, 2025	Adversarial RobustnessRetrieval	—Unverified	0
Model Unlearning via Sparse Autoencoder Subspace Guided Projections	May 30, 2025	Adversarial Robustnessfeature selection	—Unverified	0
Are classical deep neural networks weakly adversarially robust?	May 28, 2025	Adversarial DefenseAdversarial Robustness	—Unverified	0
How Do Diffusion Models Improve Adversarial Robustness?	May 28, 2025	Adversarial PurificationAdversarial Robustness	—Unverified	0
Your Classifier Can Do More: Towards Bridging the Gaps in Classification, Robustness, and Generation	May 26, 2025	Adversarial Robustness	—Unverified	0
Are Time-Series Foundation Models Deployment-Ready? A Systematic Study of Adversarial Robustness Across Domains	May 26, 2025	Adversarial RobustnessData Poisoning	—Unverified	0
Erasing Concepts, Steering Generations: A Comprehensive Survey of Concept Suppression	May 26, 2025	Adversarial RobustnessDisentanglement	—Unverified	0
Multi-Agent Reinforcement Learning in Cybersecurity: From Fundamentals to Applications	May 26, 2025	Adversarial RobustnessIntrusion Detection	—Unverified	0
Curvature Dynamic Black-box Attack: revisiting adversarial robustness via dynamic curvature estimation	May 25, 2025	Adversarial AttackAdversarial Robustness	—Unverified	0
LORE: Lagrangian-Optimized Robust Embeddings for Visual Encoders	May 24, 2025	Adversarial RobustnessOut-of-Distribution Generalization	CodeCode Available	4
Enhancing Adversarial Robustness of Vision Language Models via Adversarial Mixture Prompt Tuning	May 23, 2025	Adversarial Robustness	—Unverified	0
Experimental robustness benchmark of quantum neural network on a superconducting quantum processor	May 22, 2025	Adversarial AttackAdversarial Robustness	—Unverified	0
Few-Shot Adversarial Low-Rank Fine-Tuning of Vision-Language Models	May 21, 2025	Adversarial Robustnessparameter-efficient fine-tuning	—Unverified	0
Beyond Classification: Evaluating Diffusion Denoised Smoothing for Security-Utility Trade off	May 21, 2025	Adversarial AttackAdversarial Robustness	—Unverified	0
Lessons from Defending Gemini Against Indirect Prompt Injections	May 20, 2025	Adversarial Robustness	—Unverified	0
FlowPure: Continuous Normalizing Flows for Adversarial Purification	May 19, 2025	Adversarial PurificationAdversarial Robustness	CodeCode Available	1
Recommender Systems for Democracy: Toward Adversarial Robustness in Voting Advice Applications	May 19, 2025	Adversarial RobustnessRecommendation Systems	—Unverified	0
Adversarial Robustness for Unified Multi-Modal Encoders via Efficient Calibration	May 17, 2025	Adversarial Robustness	—Unverified	0
Adversarially Robust Spiking Neural Networks with Sparse Connectivity	May 16, 2025	Adversarial Robustness	—Unverified	0
CARES: Comprehensive Evaluation of Safety and Adversarial Robustness in Medical LLMs	May 16, 2025	Adversarial RobustnessSafety Alignment	—Unverified	0
GenoArmory: A Unified Evaluation Framework for Adversarial Attacks on Genomic Foundation Models	May 16, 2025	Adversarial AttackAdversarial Defense	CodeCode Available	1
Evaluating the Robustness of Adversarial Defenses in Malware Detection Systems	May 14, 2025	Adversarial AttackAdversarial Robustness	CodeCode Available	0
Dynamical Low-Rank Compression of Neural Networks with Robustness under Adversarial Attacks	May 12, 2025	Adversarial RobustnessLow-rank compression	—Unverified	0
Unpacking Robustness in Inflectional Languages: Adversarial Evaluation and Mechanistic Insights	May 8, 2025	Adversarial Robustness	—Unverified	0
ALMA: Aggregated Lipschitz Maximization Attack on Auto-encoders	May 6, 2025	Adversarial Robustness	—Unverified	0
Adversarial Robustness Analysis of Vision-Language Models in Medical Image Segmentation	May 5, 2025	Adversarial AttackAdversarial Robustness	CodeCode Available	0
Adversarial Robustness of Deep Learning Models for Inland Water Body Segmentation from SAR Images	May 3, 2025	Adversarial RobustnessData Poisoning	CodeCode Available	0
Quantum Support Vector Regression for Robust Anomaly Detection	May 2, 2025	Adversarial RobustnessAnomaly Detection	—Unverified	0

Show:10 25 50

← PrevPage 1 of 35Next →

All datasets AdvGLUE CIFAR-10 ImageNet ImageNet-A ImageNet-C Stylized ImageNet CIFAR-100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeBERTa (single model)	Accuracy	0.61	—	Unverified
2	ALBERT (single model)	Accuracy	0.59	—	Unverified
3	T5 (single model)	Accuracy	0.57	—	Unverified
4	SMART_RoBERTa (single model)	Accuracy	0.54	—	Unverified
5	FreeLB (single model)	Accuracy	0.5	—	Unverified
6	RoBERTa (single model)	Accuracy	0.5	—	Unverified
7	InfoBERT (single model)	Accuracy	0.46	—	Unverified
8	ELECTRA (single model)	Accuracy	0.42	—	Unverified
9	BERT (single model)	Accuracy	0.34	—	Unverified
10	SMART_BERT (single model)	Accuracy	0.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Mixed classifier	Accuracy	95.23	—	Unverified
2	Stochastic-LWTA/PGD/WideResNet-34-10	Accuracy	92.26	—	Unverified
3	Stochastic-LWTA/PGD/WideResNet-34-5	Accuracy	91.88	—	Unverified
4	GLOT-DR	Accuracy	84.13	—	Unverified
5	TRADES-ANCRA/ResNet18	Accuracy	81.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ResNet-50 (SGD, Cosine)	Accuracy	77.4	—	Unverified
2	ResNet-50 (SGD, Step)	Accuracy	76.9	—	Unverified
3	DeiT-S (AdamW, Cosine)	Accuracy	76.8	—	Unverified
4	ResNet-50 (AdamW, Cosine)	Accuracy	76.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeiT-S (AdamW, Cosine)	Accuracy	12.2	—	Unverified
2	ResNet-50 (SGD, Cosine)	Accuracy	3.3	—	Unverified
3	ResNet-50 (SGD, Step)	Accuracy	3.2	—	Unverified
4	ResNet-50 (AdamW, Cosine)	Accuracy	3.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ResNet-50 (AdamW, Cosine)	mean Corruption Error (mCE)	59.3	—	Unverified
2	ResNet-50 (SGD, Step)	mean Corruption Error (mCE)	57.9	—	Unverified
3	ResNet-50 (SGD, Cosine)	mean Corruption Error (mCE)	56.9	—	Unverified
4	DeiT-S (AdamW, Cosine)	mean Corruption Error (mCE)	48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeiT-S (AdamW, Cosine)	Accuracy	13	—	Unverified
2	ResNet-50 (SGD, Cosine)	Accuracy	8.4	—	Unverified
3	ResNet-50 (SGD, Step)	Accuracy	8.3	—	Unverified
4	ResNet-50 (AdamW, Cosine)	Accuracy	8.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Mixed Classifier	Clean Accuracy	85.21	—	Unverified
2	ResNet18/MART-ANCRA	Clean Accuracy	60.1	—	Unverified