Adversarial Robustness

Adversarial Robustness evaluates the vulnerabilities of machine learning models under various types of adversarial attacks.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 1746 papers

Title	Date	Tasks	Status	Hype
Improved Diffusion-based Generative Model with Better Adversarial Robustness	Feb 24, 2025	Adversarial RobustnessDenoising	CodeCode Available	0
Emoti-Attack: Zero-Perturbation Adversarial Attacks on NLP Systems via Emoji Sequences	Feb 24, 2025	Adversarial AttackAdversarial Robustness	—Unverified	0
Towards Optimal Adversarial Robust Reinforcement Learning with Infinity Measurement Error	Feb 23, 2025	Adversarial RobustnessDeep Reinforcement Learning	CodeCode Available	1
Mixup Model Merge: Enhancing Model Merging Performance through Randomized Linear Interpolation	Feb 21, 2025	Adversarial RobustnessData Augmentation	CodeCode Available	0
Probabilistic Robustness in Deep Learning: A Concise yet Comprehensive Guide	Feb 20, 2025	Adversarial RobustnessBenchmarking	—Unverified	0
Generalization Certificates for Adversarially Robust Bayesian Linear Regression	Feb 20, 2025	Adversarial RobustnessBayesian Inference	—Unverified	0
Adversarial Alignment for LLMs Requires Simpler, Reproducible, and More Measurable Objectives	Feb 17, 2025	Adversarial Robustness	—Unverified	0
Rethinking Audio-Visual Adversarial Vulnerability from Temporal and Modality Perspectives	Feb 17, 2025	Adversarial Robustnessaudio-visual learning	—Unverified	0
On the Promise for Assurance of Differentiable Neurosymbolic Reasoning Paradigms	Feb 13, 2025	Adversarial Robustness	—Unverified	0
General Coded Computing: Adversarial Settings	Feb 12, 2025	Adversarial Robustness	—Unverified	0
RoMA: Robust Malware Attribution via Byte-level Adversarial Training with Global Perturbations and Adversarial Consistency Regularization	Feb 11, 2025	Adversarial RobustnessMalware Detection	—Unverified	0
A Survey on Explainable Deep Reinforcement Learning	Feb 8, 2025	Adversarial RobustnessDecision Making	—Unverified	0
Adversarially-Robust TD Learning with Markovian Data: Finite-Time Rates and Fundamental Limits	Feb 7, 2025	Adversarial RobustnessReinforcement Learning (RL)	—Unverified	0
Confidence Elicitation: A New Attack Vector for Large Language Models	Feb 7, 2025	Adversarial Robustness	CodeCode Available	0
Hierarchical Contextual Manifold Alignment for Structuring Latent Representations in Large Language Models	Feb 6, 2025	Adversarial RobustnessComputational Efficiency	—Unverified	0
Improving Adversarial Robustness via Phase and Amplitude-aware Prompting	Feb 6, 2025	Adversarial Robustness	—Unverified	0
Optimizing Robustness and Accuracy in Mixture of Experts: A Dual-Model Approach	Feb 5, 2025	Adversarial RobustnessMixture-of-Experts	—Unverified	0
Uncertainty Quantification for Collaborative Object Detection Under Adversarial Attacks	Feb 4, 2025	Adversarial RobustnessAutonomous Driving	—Unverified	0
Adversarial Reasoning at Jailbreaking Time	Feb 3, 2025	Adversarial Robustness	CodeCode Available	1
Robust-LLaVA: On the Effectiveness of Large-Scale Robust Image Encoders for Multi-modal Large Language Models	Feb 3, 2025	Adversarial RobustnessImage Captioning	CodeCode Available	1
Adversarial Robustness in Two-Stage Learning-to-Defer: Algorithms and Guarantees	Feb 3, 2025	Adversarial Robustness	—Unverified	0
SecPE: Secure Prompt Ensembling for Private and Robust Large Language Models	Feb 2, 2025	Adversarial RobustnessPrivacy Preserving	—Unverified	0
Boosting Adversarial Robustness and Generalization with Structural Prior	Feb 2, 2025	Adversarial RobustnessDeep Learning	—Unverified	0
Trading Inference-Time Compute for Adversarial Robustness	Jan 31, 2025	Adversarial Robustness	—Unverified	0
Topological Signatures of Adversaries in Multimodal Alignments	Jan 29, 2025	Adversarial Robustness	—Unverified	0

Show:10 25 50

← PrevPage 5 of 70Next →

All datasets AdvGLUE CIFAR-10 ImageNet ImageNet-A ImageNet-C Stylized ImageNet CIFAR-100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeBERTa (single model)	Accuracy	0.61	—	Unverified
2	ALBERT (single model)	Accuracy	0.59	—	Unverified
3	T5 (single model)	Accuracy	0.57	—	Unverified
4	SMART_RoBERTa (single model)	Accuracy	0.54	—	Unverified
5	FreeLB (single model)	Accuracy	0.5	—	Unverified
6	RoBERTa (single model)	Accuracy	0.5	—	Unverified
7	InfoBERT (single model)	Accuracy	0.46	—	Unverified
8	ELECTRA (single model)	Accuracy	0.42	—	Unverified
9	BERT (single model)	Accuracy	0.34	—	Unverified
10	SMART_BERT (single model)	Accuracy	0.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Mixed classifier	Accuracy	95.23	—	Unverified
2	Stochastic-LWTA/PGD/WideResNet-34-10	Accuracy	92.26	—	Unverified
3	Stochastic-LWTA/PGD/WideResNet-34-5	Accuracy	91.88	—	Unverified
4	GLOT-DR	Accuracy	84.13	—	Unverified
5	TRADES-ANCRA/ResNet18	Accuracy	81.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ResNet-50 (SGD, Cosine)	Accuracy	77.4	—	Unverified
2	ResNet-50 (SGD, Step)	Accuracy	76.9	—	Unverified
3	DeiT-S (AdamW, Cosine)	Accuracy	76.8	—	Unverified
4	ResNet-50 (AdamW, Cosine)	Accuracy	76.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeiT-S (AdamW, Cosine)	Accuracy	12.2	—	Unverified
2	ResNet-50 (SGD, Cosine)	Accuracy	3.3	—	Unverified
3	ResNet-50 (SGD, Step)	Accuracy	3.2	—	Unverified
4	ResNet-50 (AdamW, Cosine)	Accuracy	3.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ResNet-50 (AdamW, Cosine)	mean Corruption Error (mCE)	59.3	—	Unverified
2	ResNet-50 (SGD, Step)	mean Corruption Error (mCE)	57.9	—	Unverified
3	ResNet-50 (SGD, Cosine)	mean Corruption Error (mCE)	56.9	—	Unverified
4	DeiT-S (AdamW, Cosine)	mean Corruption Error (mCE)	48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeiT-S (AdamW, Cosine)	Accuracy	13	—	Unverified
2	ResNet-50 (SGD, Cosine)	Accuracy	8.4	—	Unverified
3	ResNet-50 (SGD, Step)	Accuracy	8.3	—	Unverified
4	ResNet-50 (AdamW, Cosine)	Accuracy	8.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Mixed Classifier	Clean Accuracy	85.21	—	Unverified
2	ResNet18/MART-ANCRA	Clean Accuracy	60.1	—	Unverified