Adversarial Robustness

Adversarial Robustness evaluates the vulnerabilities of machine learning models under various types of adversarial attacks.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–450 of 1746 papers

Title	Date	Tasks	Status
Survey of Adversarial Robustness in Multimodal Large Language Models	Mar 18, 2025	Adversarial RobustnessSurvey	—Unverified
Evolution-based Region Adversarial Prompt Learning for Robustness Enhancement in Vision-Language Models	Mar 17, 2025	Adversarial RobustnessPrompt Learning	CodeCode Available
Robust Dataset Distillation by Matching Adversarial Trajectories	Mar 15, 2025	Adversarial RobustnessDataset Distillation	—Unverified
Robustness Tokens: Towards Adversarial Robustness of Transformers	Mar 13, 2025	Adversarial Robustness	CodeCode Available
Quantitative Analysis of Deeply Quantized Tiny Neural Networks Robust to Adversarial Attacks	Mar 12, 2025	Adversarial RobustnessQuantization	—Unverified
FairDeFace: Evaluating the Fairness and Adversarial Robustness of Face Obfuscation Methods	Mar 11, 2025	Adversarial RobustnessFace Detection	CodeCode Available
MMARD: Improving the Min-Max Optimization Process in Adversarial Robustness Distillation	Mar 9, 2025	Adversarial Robustness	—Unverified
Long-tailed Adversarial Training with Self-Distillation	Mar 9, 2025	Adversarial Robustness	—Unverified
Life-Cycle Routing Vulnerabilities of LLM Router	Mar 9, 2025	Adversarial Robustness	—Unverified
Exploring Adversarial Transferability between Kolmogorov-arnold Networks	Mar 8, 2025	Adversarial RobustnessKolmogorov-Arnold Networks	—Unverified
Adversarial Robustness of Discriminative Self-Supervised Learning in Vision	Mar 8, 2025	Adversarial RobustnessLinear evaluation	—Unverified
Transformer Meets Twicing: Harnessing Unattended Residual Information	Mar 2, 2025	Adversarial Robustnessimage-classification	CodeCode Available
Adversarial Robustness in Parameter-Space Classifiers	Feb 27, 2025	Adversarial Robustness	—Unverified
Evaluation of Hate Speech Detection Using Large Language Models and Geographical Contextualization	Feb 26, 2025	Adversarial RobustnessBinary Classification	CodeCode Available
Improved Diffusion-based Generative Model with Better Adversarial Robustness	Feb 24, 2025	Adversarial RobustnessDenoising	CodeCode Available
Emoti-Attack: Zero-Perturbation Adversarial Attacks on NLP Systems via Emoji Sequences	Feb 24, 2025	Adversarial AttackAdversarial Robustness	—Unverified
Mixup Model Merge: Enhancing Model Merging Performance through Randomized Linear Interpolation	Feb 21, 2025	Adversarial RobustnessData Augmentation	CodeCode Available
Probabilistic Robustness in Deep Learning: A Concise yet Comprehensive Guide	Feb 20, 2025	Adversarial RobustnessBenchmarking	—Unverified
Generalization Certificates for Adversarially Robust Bayesian Linear Regression	Feb 20, 2025	Adversarial RobustnessBayesian Inference	—Unverified
Rethinking Audio-Visual Adversarial Vulnerability from Temporal and Modality Perspectives	Feb 17, 2025	Adversarial Robustnessaudio-visual learning	—Unverified
Adversarial Alignment for LLMs Requires Simpler, Reproducible, and More Measurable Objectives	Feb 17, 2025	Adversarial Robustness	—Unverified
On the Promise for Assurance of Differentiable Neurosymbolic Reasoning Paradigms	Feb 13, 2025	Adversarial Robustness	—Unverified
General Coded Computing: Adversarial Settings	Feb 12, 2025	Adversarial Robustness	—Unverified
RoMA: Robust Malware Attribution via Byte-level Adversarial Training with Global Perturbations and Adversarial Consistency Regularization	Feb 11, 2025	Adversarial RobustnessMalware Detection	—Unverified
A Survey on Explainable Deep Reinforcement Learning	Feb 8, 2025	Adversarial RobustnessDecision Making	—Unverified
Confidence Elicitation: A New Attack Vector for Large Language Models	Feb 7, 2025	Adversarial Robustness	CodeCode Available
Adversarially-Robust TD Learning with Markovian Data: Finite-Time Rates and Fundamental Limits	Feb 7, 2025	Adversarial RobustnessReinforcement Learning (RL)	—Unverified
Hierarchical Contextual Manifold Alignment for Structuring Latent Representations in Large Language Models	Feb 6, 2025	Adversarial RobustnessComputational Efficiency	—Unverified
Improving Adversarial Robustness via Phase and Amplitude-aware Prompting	Feb 6, 2025	Adversarial Robustness	—Unverified
Optimizing Robustness and Accuracy in Mixture of Experts: A Dual-Model Approach	Feb 5, 2025	Adversarial RobustnessMixture-of-Experts	—Unverified
Uncertainty Quantification for Collaborative Object Detection Under Adversarial Attacks	Feb 4, 2025	Adversarial RobustnessAutonomous Driving	—Unverified
Adversarial Robustness in Two-Stage Learning-to-Defer: Algorithms and Guarantees	Feb 3, 2025	Adversarial Robustness	—Unverified
Boosting Adversarial Robustness and Generalization with Structural Prior	Feb 2, 2025	Adversarial RobustnessDeep Learning	—Unverified
SecPE: Secure Prompt Ensembling for Private and Robust Large Language Models	Feb 2, 2025	Adversarial RobustnessPrivacy Preserving	—Unverified
Trading Inference-Time Compute for Adversarial Robustness	Jan 31, 2025	Adversarial Robustness	—Unverified
CAMP in the Odyssey: Provably Robust Reinforcement Learning with Certified Radius Maximization	Jan 29, 2025	Adversarial RobustnessDeep Reinforcement Learning	CodeCode Available
Topological Signatures of Adversaries in Multimodal Alignments	Jan 29, 2025	Adversarial Robustness	—Unverified
Adversarial Masked Autoencoder Purifier with Defense Transferability	Jan 28, 2025	Adversarial DefenseAdversarial Robustness	—Unverified
Adversarial Robustness of Partitioned Quantum Classifiers	Jan 28, 2025	Adversarial RobustnessQuantum Machine Learning	—Unverified
Adversarially Robust Bloom Filters: Privacy, Reductions, and Open Problems	Jan 27, 2025	Adversarial Robustnessmodel	—Unverified
VideoPure: Diffusion-based Adversarial Purification for Video Recognition	Jan 25, 2025	Adversarial DefenseAdversarial Purification	CodeCode Available
Pre-trained Model Guided Mixture Knowledge Distillation for Adversarial Federated Learning	Jan 25, 2025	Adversarial RobustnessFederated Learning	—Unverified
A Note on Implementation Errors in Recent Adaptive Attacks Against Multi-Resolution Self-Ensembles	Jan 24, 2025	Adversarial Robustness	—Unverified
Defending against Adversarial Malware Attacks on ML-based Android Malware Detection Systems	Jan 23, 2025	Adversarial RobustnessAndroid Malware Detection	—Unverified
Framework for Progressive Knowledge Fusion in Large Language Models Through Structured Conceptual Redundancy Analysis	Jan 23, 2025	Adversarial RobustnessModel Optimization	—Unverified
A margin-based replacement for cross-entropy loss	Jan 21, 2025	Adversarial RobustnessContinual Learning	—Unverified
With Great Backbones Comes Great Adversarial Transferability	Jan 21, 2025	Adversarial RobustnessSelf-Supervised Learning	—Unverified
Double Visual Defense: Adversarial Pre-training and Instruction Tuning for Improving Vision-Language Model Robustness	Jan 16, 2025	Adversarial DefenseAdversarial Robustness	—Unverified
I Can Find You in Seconds! Leveraging Large Language Models for Code Authorship Attribution	Jan 14, 2025	Adversarial RobustnessAttribute	—Unverified
An Empirical Study of Accuracy-Robustness Tradeoff and Training Efficiency in Self-Supervised Learning	Jan 7, 2025	Adversarial RobustnessContrastive Learning	CodeCode Available

Show:10 25 50

← PrevPage 9 of 35Next →

All datasets AdvGLUE CIFAR-10 ImageNet ImageNet-A ImageNet-C Stylized ImageNet CIFAR-100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeBERTa (single model)	Accuracy	0.61	—	Unverified
2	ALBERT (single model)	Accuracy	0.59	—	Unverified
3	T5 (single model)	Accuracy	0.57	—	Unverified
4	SMART_RoBERTa (single model)	Accuracy	0.54	—	Unverified
5	FreeLB (single model)	Accuracy	0.5	—	Unverified
6	RoBERTa (single model)	Accuracy	0.5	—	Unverified
7	InfoBERT (single model)	Accuracy	0.46	—	Unverified
8	ELECTRA (single model)	Accuracy	0.42	—	Unverified
9	BERT (single model)	Accuracy	0.34	—	Unverified
10	SMART_BERT (single model)	Accuracy	0.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Mixed classifier	Accuracy	95.23	—	Unverified
2	Stochastic-LWTA/PGD/WideResNet-34-10	Accuracy	92.26	—	Unverified
3	Stochastic-LWTA/PGD/WideResNet-34-5	Accuracy	91.88	—	Unverified
4	GLOT-DR	Accuracy	84.13	—	Unverified
5	TRADES-ANCRA/ResNet18	Accuracy	81.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ResNet-50 (SGD, Cosine)	Accuracy	77.4	—	Unverified
2	ResNet-50 (SGD, Step)	Accuracy	76.9	—	Unverified
3	DeiT-S (AdamW, Cosine)	Accuracy	76.8	—	Unverified
4	ResNet-50 (AdamW, Cosine)	Accuracy	76.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeiT-S (AdamW, Cosine)	Accuracy	12.2	—	Unverified
2	ResNet-50 (SGD, Cosine)	Accuracy	3.3	—	Unverified
3	ResNet-50 (SGD, Step)	Accuracy	3.2	—	Unverified
4	ResNet-50 (AdamW, Cosine)	Accuracy	3.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ResNet-50 (AdamW, Cosine)	mean Corruption Error (mCE)	59.3	—	Unverified
2	ResNet-50 (SGD, Step)	mean Corruption Error (mCE)	57.9	—	Unverified
3	ResNet-50 (SGD, Cosine)	mean Corruption Error (mCE)	56.9	—	Unverified
4	DeiT-S (AdamW, Cosine)	mean Corruption Error (mCE)	48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeiT-S (AdamW, Cosine)	Accuracy	13	—	Unverified
2	ResNet-50 (SGD, Cosine)	Accuracy	8.4	—	Unverified
3	ResNet-50 (SGD, Step)	Accuracy	8.3	—	Unverified
4	ResNet-50 (AdamW, Cosine)	Accuracy	8.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Mixed Classifier	Clean Accuracy	85.21	—	Unverified
2	ResNet18/MART-ANCRA	Clean Accuracy	60.1	—	Unverified