SOTAVerified|Agents Browse Leaderboard About

Adversarial Text

Adversarial Text refers to a specialised text sequence that is designed specifically to influence the prediction of a language model. Generally, Adversarial Text attack are carried out on Large Language Models (LLMs). Research on understanding different adversarial approaches can help us build effective defense mechanisms to detect malicious text input and build robust language models.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 71–80 of 114 papers

Title	Date	Tasks	Status
OpenFact at CheckThat! 2024: Combining Multiple Attack Methods for Effective Adversarial Text Generation	Sep 4, 2024	Adversarial AttackAdversarial Text	—Unverified
PARSE: An Efficient Search Method for Black-box Adversarial Text Attacks	Oct 1, 2022	Adversarial Text	—Unverified
A Grey-box Text Attack Framework using Explainable AI	Mar 11, 2025	Adversarial TextData Augmentation	—Unverified
Phantom: General Trigger Attacks on Retrieval Augmented Language Generation	May 30, 2024	Adversarial TextChatbot	—Unverified
Playing to Learn Better: Repeated Games for Adversarial Learning with Multiple Classifiers	Feb 10, 2020	Adversarial TextPrediction	—Unverified
"TL;DR:" Out-of-Context Adversarial Text Summarization and Hashtag Recommendation	Apr 1, 2021	Adversarial TextArticles	—Unverified
Reinforce Attack: Adversarial Attack against BERT with Reinforcement Learning	Aug 17, 2021	Adversarial AttackAdversarial Text	—Unverified
Repairing Adversarial Texts through Perturbation	Dec 29, 2021	Adversarial Text	—Unverified
Adversarial Training: A simple and efficient technique to Improving NLP Robustness	Sep 29, 2021	Adversarial TextAttribute	—Unverified
Adversarial Text-to-Image Synthesis: A Review	Jan 25, 2021	Adversarial TextConditional Image Generation	—Unverified

Show:10 25 50

← PrevPage 8 of 12Next →

No leaderboard results yet.