SOTAVerified|Agents Browse Leaderboard About

Adversarial Text

Adversarial Text refers to a specialised text sequence that is designed specifically to influence the prediction of a language model. Generally, Adversarial Text attack are carried out on Large Language Models (LLMs). Research on understanding different adversarial approaches can help us build effective defense mechanisms to detect malicious text input and build robust language models.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 71–80 of 114 papers

Title	Date	Tasks	Status
TAPE: Assessing Few-shot Russian Language Understanding	Oct 23, 2022	Adversarial AttackAdversarial Text	CodeCode Available
PARSE: An Efficient Search Method for Black-box Adversarial Text Attacks	Oct 1, 2022	Adversarial Text	—Unverified
Adversarial Text Normalization	Jun 8, 2022	Adversarial TextNatural Language Inference	—Unverified
Detecting Word-Level Adversarial Text Attacks via SHapley Additive exPlanations	May 1, 2022	Adversarial Text	—Unverified
“That Is a Suspicious Reaction!”: Interpreting Logits Variation to Detect NLP Adversarial Attacks	May 1, 2022	Adversarial Text	—Unverified
Adversarial Robustness of Neural-Statistical Features in Detection of Generative Transformers	Mar 2, 2022	Adversarial RobustnessAdversarial Text	CodeCode Available
Data-Driven Mitigation of Adversarial Text Perturbation	Feb 19, 2022	Adversarial TextClassification	—Unverified
Identifying Adversarial Attacks on Text Classifiers	Jan 21, 2022	Abuse DetectionAdversarial Text	—Unverified
SemAttack: Natural Textual Attacks via Different Semantic Spaces	Jan 16, 2022	Adversarial Text	—Unverified
Repairing Adversarial Texts through Perturbation	Dec 29, 2021	Adversarial Text	—Unverified

Show:10 25 50

← PrevPage 8 of 12Next →

No leaderboard results yet.