Adversarial Robustness

Adversarial Robustness evaluates the vulnerabilities of machine learning models under various types of adversarial attacks.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–150 of 1746 papers

Title	Date	Tasks	Status	Hype
Improved Diffusion-based Generative Model with Better Adversarial Robustness	Feb 24, 2025	Adversarial RobustnessDenoising	CodeCode Available	0
Emoti-Attack: Zero-Perturbation Adversarial Attacks on NLP Systems via Emoji Sequences	Feb 24, 2025	Adversarial AttackAdversarial Robustness	—Unverified	0
Towards Optimal Adversarial Robust Reinforcement Learning with Infinity Measurement Error	Feb 23, 2025	Adversarial RobustnessDeep Reinforcement Learning	CodeCode Available	1
Mixup Model Merge: Enhancing Model Merging Performance through Randomized Linear Interpolation	Feb 21, 2025	Adversarial RobustnessData Augmentation	CodeCode Available	0
Probabilistic Robustness in Deep Learning: A Concise yet Comprehensive Guide	Feb 20, 2025	Adversarial RobustnessBenchmarking	—Unverified	0
Generalization Certificates for Adversarially Robust Bayesian Linear Regression	Feb 20, 2025	Adversarial RobustnessBayesian Inference	—Unverified	0
Adversarial Alignment for LLMs Requires Simpler, Reproducible, and More Measurable Objectives	Feb 17, 2025	Adversarial Robustness	—Unverified	0
Rethinking Audio-Visual Adversarial Vulnerability from Temporal and Modality Perspectives	Feb 17, 2025	Adversarial Robustnessaudio-visual learning	—Unverified	0
On the Promise for Assurance of Differentiable Neurosymbolic Reasoning Paradigms	Feb 13, 2025	Adversarial Robustness	—Unverified	0
General Coded Computing: Adversarial Settings	Feb 12, 2025	Adversarial Robustness	—Unverified	0
RoMA: Robust Malware Attribution via Byte-level Adversarial Training with Global Perturbations and Adversarial Consistency Regularization	Feb 11, 2025	Adversarial RobustnessMalware Detection	—Unverified	0
A Survey on Explainable Deep Reinforcement Learning	Feb 8, 2025	Adversarial RobustnessDecision Making	—Unverified	0
Adversarially-Robust TD Learning with Markovian Data: Finite-Time Rates and Fundamental Limits	Feb 7, 2025	Adversarial RobustnessReinforcement Learning (RL)	—Unverified	0
Confidence Elicitation: A New Attack Vector for Large Language Models	Feb 7, 2025	Adversarial Robustness	CodeCode Available	0
Hierarchical Contextual Manifold Alignment for Structuring Latent Representations in Large Language Models	Feb 6, 2025	Adversarial RobustnessComputational Efficiency	—Unverified	0
Improving Adversarial Robustness via Phase and Amplitude-aware Prompting	Feb 6, 2025	Adversarial Robustness	—Unverified	0
Optimizing Robustness and Accuracy in Mixture of Experts: A Dual-Model Approach	Feb 5, 2025	Adversarial RobustnessMixture-of-Experts	—Unverified	0
Uncertainty Quantification for Collaborative Object Detection Under Adversarial Attacks	Feb 4, 2025	Adversarial RobustnessAutonomous Driving	—Unverified	0
Adversarial Reasoning at Jailbreaking Time	Feb 3, 2025	Adversarial Robustness	CodeCode Available	1
Robust-LLaVA: On the Effectiveness of Large-Scale Robust Image Encoders for Multi-modal Large Language Models	Feb 3, 2025	Adversarial RobustnessImage Captioning	CodeCode Available	1
Adversarial Robustness in Two-Stage Learning-to-Defer: Algorithms and Guarantees	Feb 3, 2025	Adversarial Robustness	—Unverified	0
SecPE: Secure Prompt Ensembling for Private and Robust Large Language Models	Feb 2, 2025	Adversarial RobustnessPrivacy Preserving	—Unverified	0
Boosting Adversarial Robustness and Generalization with Structural Prior	Feb 2, 2025	Adversarial RobustnessDeep Learning	—Unverified	0
Trading Inference-Time Compute for Adversarial Robustness	Jan 31, 2025	Adversarial Robustness	—Unverified	0
CAMP in the Odyssey: Provably Robust Reinforcement Learning with Certified Radius Maximization	Jan 29, 2025	Adversarial RobustnessDeep Reinforcement Learning	CodeCode Available	0
Topological Signatures of Adversaries in Multimodal Alignments	Jan 29, 2025	Adversarial Robustness	—Unverified	0
Adversarial Robustness of Partitioned Quantum Classifiers	Jan 28, 2025	Adversarial RobustnessQuantum Machine Learning	—Unverified	0
Adversarial Masked Autoencoder Purifier with Defense Transferability	Jan 28, 2025	Adversarial DefenseAdversarial Robustness	—Unverified	0
Adversarially Robust Bloom Filters: Privacy, Reductions, and Open Problems	Jan 27, 2025	Adversarial Robustnessmodel	—Unverified	0
Pre-trained Model Guided Mixture Knowledge Distillation for Adversarial Federated Learning	Jan 25, 2025	Adversarial RobustnessFederated Learning	—Unverified	0
VideoPure: Diffusion-based Adversarial Purification for Video Recognition	Jan 25, 2025	Adversarial DefenseAdversarial Purification	CodeCode Available	0
A Note on Implementation Errors in Recent Adaptive Attacks Against Multi-Resolution Self-Ensembles	Jan 24, 2025	Adversarial Robustness	—Unverified	0
Framework for Progressive Knowledge Fusion in Large Language Models Through Structured Conceptual Redundancy Analysis	Jan 23, 2025	Adversarial RobustnessModel Optimization	—Unverified	0
Defending against Adversarial Malware Attacks on ML-based Android Malware Detection Systems	Jan 23, 2025	Adversarial RobustnessAndroid Malware Detection	—Unverified	0
A margin-based replacement for cross-entropy loss	Jan 21, 2025	Adversarial RobustnessContinual Learning	—Unverified	0
With Great Backbones Comes Great Adversarial Transferability	Jan 21, 2025	Adversarial RobustnessSelf-Supervised Learning	—Unverified	0
Double Visual Defense: Adversarial Pre-training and Instruction Tuning for Improving Vision-Language Model Robustness	Jan 16, 2025	Adversarial DefenseAdversarial Robustness	—Unverified	0
An Adaptive Orthogonal Convolution Scheme for Efficient and Flexible CNN Architectures	Jan 14, 2025	Adversarial Robustness	CodeCode Available	1
I Can Find You in Seconds! Leveraging Large Language Models for Code Authorship Attribution	Jan 14, 2025	Adversarial RobustnessAttribute	—Unverified	0
An Empirical Study of Accuracy-Robustness Tradeoff and Training Efficiency in Self-Supervised Learning	Jan 7, 2025	Adversarial RobustnessContrastive Learning	CodeCode Available	0
On the Adversarial Robustness of Benjamini Hochberg	Jan 6, 2025	Adversarial RobustnessAnomaly Detection	—Unverified	0
Tougher Text, Smarter Models: Raising the Bar for Adversarial Defence Benchmarks	Jan 5, 2025	Adversarial RobustnessBenchmarking	CodeCode Available	0
Towards Robust and Accurate Stability Estimation of Local Surrogate Models in Text-based Explainable AI	Jan 3, 2025	Adversarial Robustness	—Unverified	0
Rerouting LLM Routers	Jan 3, 2025	Adversarial Robustness	—Unverified	0
On the Zero-shot Adversarial Robustness of Vision-Language Models: A Truly Zero-shot and Training-free Approach	Jan 1, 2025	Adversarial RobustnessZero-shot Generalization	—Unverified	0
Advancing Adversarial Robustness in GNeRFs: The IL2-NeRF Attack	Jan 1, 2025	3D ReconstructionAdversarial Attack	CodeCode Available	0
Rethinking the Adversarial Robustness of Multi-Exit Neural Networks in an Attack-Defense Game	Jan 1, 2025	Adversarial Robustness	—Unverified	0
RobustBlack: Challenging Black-Box Adversarial Attacks on State-of-the-Art Defenses	Dec 30, 2024	Adversarial Robustness	—Unverified	0
On Adversarial Robustness of Language Models in Transfer Learning	Dec 29, 2024	Adversarial RobustnessTransfer Learning	—Unverified	0
A Robust Adversarial Ensemble with Causal (Feature Interaction) Interpretations for Image Classification	Dec 28, 2024	Adversarial Robustnesscounterfactual	—Unverified	0

Show:10 25 50

← PrevPage 3 of 35Next →

All datasets AdvGLUE CIFAR-10 ImageNet ImageNet-A ImageNet-C Stylized ImageNet CIFAR-100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeBERTa (single model)	Accuracy	0.61	—	Unverified
2	ALBERT (single model)	Accuracy	0.59	—	Unverified
3	T5 (single model)	Accuracy	0.57	—	Unverified
4	SMART_RoBERTa (single model)	Accuracy	0.54	—	Unverified
5	FreeLB (single model)	Accuracy	0.5	—	Unverified
6	RoBERTa (single model)	Accuracy	0.5	—	Unverified
7	InfoBERT (single model)	Accuracy	0.46	—	Unverified
8	ELECTRA (single model)	Accuracy	0.42	—	Unverified
9	BERT (single model)	Accuracy	0.34	—	Unverified
10	SMART_BERT (single model)	Accuracy	0.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Mixed classifier	Accuracy	95.23	—	Unverified
2	Stochastic-LWTA/PGD/WideResNet-34-10	Accuracy	92.26	—	Unverified
3	Stochastic-LWTA/PGD/WideResNet-34-5	Accuracy	91.88	—	Unverified
4	GLOT-DR	Accuracy	84.13	—	Unverified
5	TRADES-ANCRA/ResNet18	Accuracy	81.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ResNet-50 (SGD, Cosine)	Accuracy	77.4	—	Unverified
2	ResNet-50 (SGD, Step)	Accuracy	76.9	—	Unverified
3	DeiT-S (AdamW, Cosine)	Accuracy	76.8	—	Unverified
4	ResNet-50 (AdamW, Cosine)	Accuracy	76.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeiT-S (AdamW, Cosine)	Accuracy	12.2	—	Unverified
2	ResNet-50 (SGD, Cosine)	Accuracy	3.3	—	Unverified
3	ResNet-50 (SGD, Step)	Accuracy	3.2	—	Unverified
4	ResNet-50 (AdamW, Cosine)	Accuracy	3.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ResNet-50 (AdamW, Cosine)	mean Corruption Error (mCE)	59.3	—	Unverified
2	ResNet-50 (SGD, Step)	mean Corruption Error (mCE)	57.9	—	Unverified
3	ResNet-50 (SGD, Cosine)	mean Corruption Error (mCE)	56.9	—	Unverified
4	DeiT-S (AdamW, Cosine)	mean Corruption Error (mCE)	48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeiT-S (AdamW, Cosine)	Accuracy	13	—	Unverified
2	ResNet-50 (SGD, Cosine)	Accuracy	8.4	—	Unverified
3	ResNet-50 (SGD, Step)	Accuracy	8.3	—	Unverified
4	ResNet-50 (AdamW, Cosine)	Accuracy	8.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Mixed Classifier	Clean Accuracy	85.21	—	Unverified
2	ResNet18/MART-ANCRA	Clean Accuracy	60.1	—	Unverified