Adversarial Robustness

Adversarial Robustness evaluates the vulnerabilities of machine learning models under various types of adversarial attacks.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 351–400 of 1746 papers

Title	Date	Tasks	Status
Erasing Concepts, Steering Generations: A Comprehensive Survey of Concept Suppression	May 26, 2025	Adversarial RobustnessDisentanglement	—Unverified
Are Time-Series Foundation Models Deployment-Ready? A Systematic Study of Adversarial Robustness Across Domains	May 26, 2025	Adversarial RobustnessData Poisoning	—Unverified
Curvature Dynamic Black-box Attack: revisiting adversarial robustness via dynamic curvature estimation	May 25, 2025	Adversarial AttackAdversarial Robustness	—Unverified
Enhancing Adversarial Robustness of Vision Language Models via Adversarial Mixture Prompt Tuning	May 23, 2025	Adversarial Robustness	—Unverified
Experimental robustness benchmark of quantum neural network on a superconducting quantum processor	May 22, 2025	Adversarial AttackAdversarial Robustness	—Unverified
Beyond Classification: Evaluating Diffusion Denoised Smoothing for Security-Utility Trade off	May 21, 2025	Adversarial AttackAdversarial Robustness	—Unverified
Few-Shot Adversarial Low-Rank Fine-Tuning of Vision-Language Models	May 21, 2025	Adversarial Robustnessparameter-efficient fine-tuning	—Unverified
Lessons from Defending Gemini Against Indirect Prompt Injections	May 20, 2025	Adversarial Robustness	—Unverified
Recommender Systems for Democracy: Toward Adversarial Robustness in Voting Advice Applications	May 19, 2025	Adversarial RobustnessRecommendation Systems	—Unverified
Adversarial Robustness for Unified Multi-Modal Encoders via Efficient Calibration	May 17, 2025	Adversarial Robustness	—Unverified
CARES: Comprehensive Evaluation of Safety and Adversarial Robustness in Medical LLMs	May 16, 2025	Adversarial RobustnessSafety Alignment	—Unverified
Adversarially Robust Spiking Neural Networks with Sparse Connectivity	May 16, 2025	Adversarial Robustness	—Unverified
Evaluating the Robustness of Adversarial Defenses in Malware Detection Systems	May 14, 2025	Adversarial AttackAdversarial Robustness	CodeCode Available
Dynamical Low-Rank Compression of Neural Networks with Robustness under Adversarial Attacks	May 12, 2025	Adversarial RobustnessLow-rank compression	—Unverified
Unpacking Robustness in Inflectional Languages: Adversarial Evaluation and Mechanistic Insights	May 8, 2025	Adversarial Robustness	—Unverified
ALMA: Aggregated Lipschitz Maximization Attack on Auto-encoders	May 6, 2025	Adversarial Robustness	—Unverified
Adversarial Robustness Analysis of Vision-Language Models in Medical Image Segmentation	May 5, 2025	Adversarial AttackAdversarial Robustness	CodeCode Available
Adversarial Robustness of Deep Learning Models for Inland Water Body Segmentation from SAR Images	May 3, 2025	Adversarial RobustnessData Poisoning	CodeCode Available
Quantum Support Vector Regression for Robust Anomaly Detection	May 2, 2025	Adversarial RobustnessAnomaly Detection	—Unverified
Towards Robust LLMs: an Adversarial Robustness Measurement Framework	Apr 24, 2025	Adversarial RobustnessComputational Efficiency	CodeCode Available
aiXamine: Simplified LLM Safety and Security	Apr 21, 2025	2kAdversarial Robustness	—Unverified
Fast Adversarial Training with Weak-to-Strong Spatial-Temporal Consistency in the Frequency Domain on Videos	Apr 21, 2025	Adversarial RobustnessVideo Recognition	—Unverified
Multimodal Large Language Models for Enhanced Traffic Safety: A Comprehensive Review and Future Trends	Apr 21, 2025	Adversarial RobustnessDecision Making	—Unverified
Hydra: An Agentic Reasoning Approach for Enhancing Adversarial Robustness and Mitigating Hallucinations in Vision-Language Models	Apr 19, 2025	Adversarial AttackAdversarial Defense	—Unverified
RDI: An adversarial robustness evaluation metric for deep neural networks based on model statistical features	Apr 16, 2025	Adversarial RobustnessComputational Efficiency	CodeCode Available
How to Enhance Downstream Adversarial Robustness (almost) without Touching the Pre-Trained Foundation Model?	Apr 15, 2025	Adversarial RobustnessContrastive Learning	—Unverified
The Sword of Damocles in ViTs: Computational Redundancy Amplifies Adversarial Transferability	Apr 15, 2025	Adversarial Robustness	—Unverified
Beyond Worst-Case Online Classification: VC-Based Regret Bounds for Relaxed Benchmarks	Apr 14, 2025	Adversarial RobustnessBinary Classification	—Unverified
Adversarial Examples in Environment Perception for Automated Driving (Review)	Apr 11, 2025	Adversarial Robustness	—Unverified
Toward Spiking Neural Network Local Learning Modules Resistant to Adversarial Attacks	Apr 11, 2025	Adversarial AttackAdversarial Robustness	—Unverified
Benchmarking Adversarial Robustness to Bias Elicitation in Large Language Models: Scalable Automated Assessment with LLM-as-a-Judge	Apr 10, 2025	Adversarial RobustnessBenchmarking	CodeCode Available
A Domain-Based Taxonomy of Jailbreak Vulnerabilities in Large Language Models	Apr 7, 2025	Adversarial Robustness	—Unverified
Secure Diagnostics: Adversarial Robustness Meets Clinical Interpretability	Apr 7, 2025	Adversarial AttackAdversarial Robustness	—Unverified
Two is Better than One: Efficient Ensemble Defense for Robust and Compact Models	Apr 7, 2025	Adversarial RobustnessDiversity	—Unverified
A Study on Adversarial Robustness of Discriminative Prototypical Learning	Apr 3, 2025	Adversarial Robustness	CodeCode Available
Bridging the Theoretical Gap in Randomized Smoothing	Apr 3, 2025	Adversarial Robustness	CodeCode Available
AdPO: Enhancing the Adversarial Robustness of Large Vision-Language Models with Preference Optimization	Apr 2, 2025	Adversarial DefenseAdversarial Robustness	—Unverified
Robust Unsupervised Domain Adaptation for 3D Point Cloud Segmentation Under Source Adversarial Attacks	Apr 2, 2025	Adversarial RobustnessDecoder	—Unverified
Lipschitz Constant Meets Condition Number: Learning Robust and Compact Deep Neural Networks	Mar 26, 2025	Adversarial RobustnessNetwork Pruning	—Unverified
Feature Statistics with Uncertainty Help Adversarial Robustness	Mar 26, 2025	Adversarial Robustness	CodeCode Available
ATP: Adaptive Threshold Pruning for Efficient Data Encoding in Quantum Neural Networks	Mar 26, 2025	Adversarial RobustnessComputational Efficiency	—Unverified
Stop Walking in Circles! Bailing Out Early in Projected Gradient Descent	Mar 25, 2025	Adversarial Robustness	—Unverified
Masks and Mimicry: Strategic Obfuscation and Impersonation Attacks on Authorship Verification	Mar 24, 2025	Adversarial RobustnessAuthorship Verification	—Unverified
When is dataset cartography ineffective? Using training dynamics does not improve robustness against Adversarial SQuAD	Mar 24, 2025	Adversarial RobustnessExtractive Question-Answering	—Unverified
Robustness of deep learning classification to adversarial input on GPUs: asynchronous parallel accumulation is a source of vulnerability	Mar 21, 2025	Adversarial RobustnessBayesian Optimization	—Unverified
Principal Eigenvalue Regularization for Improved Worst-Class Certified Robustness of Smoothed Classifiers	Mar 21, 2025	Adversarial RobustnessFairness	—Unverified
Narrowing Class-Wise Robustness Gaps in Adversarial Training	Mar 20, 2025	Adversarial RobustnessClass-Specific Performance	—Unverified
On the Robustness Tradeoff in Fine-Tuning	Mar 19, 2025	Adversarial Robustness	—Unverified
MMDT: Decoding the Trustworthiness and Safety of Multimodal Foundation Models	Mar 19, 2025	Adversarial RobustnessAutonomous Driving	—Unverified
Survey of Adversarial Robustness in Multimodal Large Language Models	Mar 18, 2025	Adversarial RobustnessSurvey	—Unverified

Show:10 25 50

← PrevPage 8 of 35Next →

All datasets AdvGLUE CIFAR-10 ImageNet ImageNet-A ImageNet-C Stylized ImageNet CIFAR-100

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeBERTa (single model)	Accuracy	0.61	—	Unverified
2	ALBERT (single model)	Accuracy	0.59	—	Unverified
3	T5 (single model)	Accuracy	0.57	—	Unverified
4	SMART_RoBERTa (single model)	Accuracy	0.54	—	Unverified
5	FreeLB (single model)	Accuracy	0.5	—	Unverified
6	RoBERTa (single model)	Accuracy	0.5	—	Unverified
7	InfoBERT (single model)	Accuracy	0.46	—	Unverified
8	ELECTRA (single model)	Accuracy	0.42	—	Unverified
9	BERT (single model)	Accuracy	0.34	—	Unverified
10	SMART_BERT (single model)	Accuracy	0.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Mixed classifier	Accuracy	95.23	—	Unverified
2	Stochastic-LWTA/PGD/WideResNet-34-10	Accuracy	92.26	—	Unverified
3	Stochastic-LWTA/PGD/WideResNet-34-5	Accuracy	91.88	—	Unverified
4	GLOT-DR	Accuracy	84.13	—	Unverified
5	TRADES-ANCRA/ResNet18	Accuracy	81.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ResNet-50 (SGD, Cosine)	Accuracy	77.4	—	Unverified
2	ResNet-50 (SGD, Step)	Accuracy	76.9	—	Unverified
3	DeiT-S (AdamW, Cosine)	Accuracy	76.8	—	Unverified
4	ResNet-50 (AdamW, Cosine)	Accuracy	76.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeiT-S (AdamW, Cosine)	Accuracy	12.2	—	Unverified
2	ResNet-50 (SGD, Cosine)	Accuracy	3.3	—	Unverified
3	ResNet-50 (SGD, Step)	Accuracy	3.2	—	Unverified
4	ResNet-50 (AdamW, Cosine)	Accuracy	3.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ResNet-50 (AdamW, Cosine)	mean Corruption Error (mCE)	59.3	—	Unverified
2	ResNet-50 (SGD, Step)	mean Corruption Error (mCE)	57.9	—	Unverified
3	ResNet-50 (SGD, Cosine)	mean Corruption Error (mCE)	56.9	—	Unverified
4	DeiT-S (AdamW, Cosine)	mean Corruption Error (mCE)	48	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DeiT-S (AdamW, Cosine)	Accuracy	13	—	Unverified
2	ResNet-50 (SGD, Cosine)	Accuracy	8.4	—	Unverified
3	ResNet-50 (SGD, Step)	Accuracy	8.3	—	Unverified
4	ResNet-50 (AdamW, Cosine)	Accuracy	8.1	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Mixed Classifier	Clean Accuracy	85.21	—	Unverified
2	ResNet18/MART-ANCRA	Clean Accuracy	60.1	—	Unverified