SOTAVerified|Agents Browse Leaderboard About

Adversarial Text

Adversarial Text refers to a specialised text sequence that is designed specifically to influence the prediction of a language model. Generally, Adversarial Text attack are carried out on Large Language Models (LLMs). Research on understanding different adversarial approaches can help us build effective defense mechanisms to detect malicious text input and build robust language models.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 71–80 of 114 papers

Title	Date	Tasks	Status	Hype
Don’t Search for a Search Method — Simple Heuristics Suffice for Adversarial Text Attacks	Nov 1, 2021	Adversarial Text	—Unverified	0
Generating Watermarked Adversarial Texts	Oct 25, 2021	Adversarial AttackAdversarial Text	—Unverified	0
SEPP: Similarity Estimation of Predicted Probabilities for Defending and Detecting Adversarial Text	Oct 12, 2021	Adversarial TextClassification	CodeCode Available	0
Adversarial Training: A simple and efficient technique to Improving NLP Robustness	Sep 29, 2021	Adversarial TextAttribute	—Unverified	0
Don't Search for a Search Method -- Simple Heuristics Suffice for Adversarial Text Attacks	Sep 16, 2021	Adversarial Text	—Unverified	0
Semantic-Preserving Adversarial Text Attacks	Aug 23, 2021	Adversarial TextSemantic Similarity	CodeCode Available	1
Reinforce Attack: Adversarial Attack against BERT with Reinforcement Learning	Aug 17, 2021	Adversarial AttackAdversarial Text	—Unverified	0
DISCO : efficient unsupervised decoding for discrete natural language problems via convex relaxation	Jul 7, 2021	Adversarial TextText Generation	—Unverified	0
Detecting Adversarial Text Attacks via SHapley Additive exPlanations	May 16, 2021	Adversarial TextSST-2	—Unverified	0
MATE-KD: Masked Adversarial TExt, a Companion to Knowledge Distillation	May 12, 2021	Adversarial TextData Augmentation	CodeCode Available	1

Show:10 25 50

← PrevPage 8 of 12Next →

No leaderboard results yet.