Adversarial Robustness

Adversarial Robustness evaluates the vulnerabilities of machine learning models under various types of adversarial attacks.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 1746 papers

Title	Date	Tasks	Status	Hype
Bridging Robustness and Generalization Against Word Substitution Attacks in NLP via the Growth Bound Matrix Approach	Jul 14, 2025	Adversarial DefenseAdversarial Robustness	CodeCode Available	0
Tail-aware Adversarial Attacks: A Distributional Approach to Efficient LLM Jailbreaking	Jul 6, 2025	Adversarial Robustness	—Unverified	0
Rectifying Adversarial Sample with Low Entropy Prior for Test-Time Defense	Jul 4, 2025	Adversarial Robustness	—Unverified	0
Evaluating the Evaluators: Trust in Adversarial Robustness Tests	Jul 4, 2025	Adversarial Robustness	—Unverified	0
Is Reasoning All You Need? Probing Bias in the Age of Reasoning Language Models	Jul 3, 2025	Adversarial RobustnessAll	—Unverified	0
NIC-RobustBench: A Comprehensive Open-Source Toolkit for Neural Image Compression and Robustness Analysis	Jun 23, 2025	Adversarial RobustnessImage Compression	CodeCode Available	1
PRISON: Unmasking the Criminal Potential of Large Language Models	Jun 19, 2025	Adversarial Robustness	—Unverified	0
NAP-Tuning: Neural Augmented Prompt Tuning for Adversarially Robust Vision-Language Models	Jun 15, 2025	Adversarial Robustness	—Unverified	0
Intriguing Frequency Interpretation of Adversarial Robustness for CNNs and ViTs	Jun 15, 2025	Adversarial Robustnessimage-classification	—Unverified	0
Canonical Latent Representations in Conditional Diffusion Models	Jun 11, 2025	Adversarial RobustnessRepresentation Learning	—Unverified	0
PatchGuard: Adversarially Robust Anomaly Detection and Localization through Vision Transformers and Pseudo Anomalies	Jun 10, 2025	Adversarial RobustnessAnomaly Detection	CodeCode Available	1
Towards Class-wise Fair Adversarial Training via Anti-Bias Soft Label Distillation	Jun 10, 2025	Adversarial RobustnessFairness	CodeCode Available	0
The interplay of robustness and generalization in quantum machine learning	Jun 10, 2025	Adversarial RobustnessQuantum Machine Learning	CodeCode Available	0
Enhancing Adversarial Robustness with Conformal Prediction: A Framework for Guaranteed Model Reliability	Jun 9, 2025	Adversarial AttackAdversarial Robustness	CodeCode Available	0
ProARD: progressive adversarial robustness distillation: provide wide range of robust students	Jun 9, 2025	Adversarial Robustness	CodeCode Available	0
Sylva: Tailoring Personalized Adversarial Defense in Pre-trained Models via Collaborative Fine-tuning	Jun 4, 2025	Adversarial DefenseAdversarial Robustness	—Unverified	0
RAID: A Dataset for Testing the Adversarial Robustness of AI-Generated Image Detectors	Jun 4, 2025	Adversarial Robustness	CodeCode Available	0
Dynamic Epsilon Scheduling: A Multi-Factor Adaptive Perturbation Budget for Adversarial Training	Jun 3, 2025	Adversarial RobustnessScheduling	—Unverified	0
Speech Unlearning	Jun 1, 2025	Adversarial RobustnessKeyword Spotting	—Unverified	0
SafeGenes: Evaluating the Adversarial Robustness of Genomic Foundation Models	Jun 1, 2025	Adversarial Robustness	—Unverified	0
A Flat Minima Perspective on Understanding Augmentations and Model Robustness	May 30, 2025	Adversarial RobustnessData Augmentation	—Unverified	0
Model Unlearning via Sparse Autoencoder Subspace Guided Projections	May 30, 2025	Adversarial Robustnessfeature selection	—Unverified	0
On the Scaling of Robustness and Effectiveness in Dense Retrieval	May 30, 2025	Adversarial RobustnessRetrieval	—Unverified	0
The Butterfly Effect in Pathology: Exploring Security in Pathology Foundation Models	May 30, 2025	Adversarial Robustness	CodeCode Available	0
Are classical deep neural networks weakly adversarially robust?	May 28, 2025	Adversarial DefenseAdversarial Robustness	—Unverified	0

Show:10 25 50

← PrevPage 1 of 70Next →

All datasets AdvGLUE CIFAR-10 ImageNet ImageNet-A ImageNet-C Stylized ImageNet CIFAR-100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeBERTa (single model)	Accuracy	0.61	—	Unverified
2	ALBERT (single model)	Accuracy	0.59	—	Unverified
3	T5 (single model)	Accuracy	0.57	—	Unverified
4	SMART_RoBERTa (single model)	Accuracy	0.54	—	Unverified
5	FreeLB (single model)	Accuracy	0.5	—	Unverified
6	RoBERTa (single model)	Accuracy	0.5	—	Unverified
7	InfoBERT (single model)	Accuracy	0.46	—	Unverified
8	ELECTRA (single model)	Accuracy	0.42	—	Unverified
9	BERT (single model)	Accuracy	0.34	—	Unverified
10	SMART_BERT (single model)	Accuracy	0.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Mixed classifier	Accuracy	95.23	—	Unverified
2	Stochastic-LWTA/PGD/WideResNet-34-10	Accuracy	92.26	—	Unverified
3	Stochastic-LWTA/PGD/WideResNet-34-5	Accuracy	91.88	—	Unverified
4	GLOT-DR	Accuracy	84.13	—	Unverified
5	TRADES-ANCRA/ResNet18	Accuracy	81.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ResNet-50 (SGD, Cosine)	Accuracy	77.4	—	Unverified
2	ResNet-50 (SGD, Step)	Accuracy	76.9	—	Unverified
3	DeiT-S (AdamW, Cosine)	Accuracy	76.8	—	Unverified
4	ResNet-50 (AdamW, Cosine)	Accuracy	76.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeiT-S (AdamW, Cosine)	Accuracy	12.2	—	Unverified
2	ResNet-50 (SGD, Cosine)	Accuracy	3.3	—	Unverified
3	ResNet-50 (SGD, Step)	Accuracy	3.2	—	Unverified
4	ResNet-50 (AdamW, Cosine)	Accuracy	3.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ResNet-50 (AdamW, Cosine)	mean Corruption Error (mCE)	59.3	—	Unverified
2	ResNet-50 (SGD, Step)	mean Corruption Error (mCE)	57.9	—	Unverified
3	ResNet-50 (SGD, Cosine)	mean Corruption Error (mCE)	56.9	—	Unverified
4	DeiT-S (AdamW, Cosine)	mean Corruption Error (mCE)	48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeiT-S (AdamW, Cosine)	Accuracy	13	—	Unverified
2	ResNet-50 (SGD, Cosine)	Accuracy	8.4	—	Unverified
3	ResNet-50 (SGD, Step)	Accuracy	8.3	—	Unverified
4	ResNet-50 (AdamW, Cosine)	Accuracy	8.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Mixed Classifier	Clean Accuracy	85.21	—	Unverified
2	ResNet18/MART-ANCRA	Clean Accuracy	60.1	—	Unverified