SOTAVerified|Agents Browse Leaderboard About

Adversarial Text

Adversarial Text refers to a specialised text sequence that is designed specifically to influence the prediction of a language model. Generally, Adversarial Text attack are carried out on Large Language Models (LLMs). Research on understanding different adversarial approaches can help us build effective defense mechanisms to detect malicious text input and build robust language models.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 61–70 of 114 papers

Title	Date	Tasks	Status
PBI-Attack: Prior-Guided Bimodal Interactive Black-Box Jailbreak Attack for Toxicity Maximization	Dec 8, 2024	Adversarial TextPrompt Engineering	—Unverified
Improved Training of Mixture-of-Experts Language GANs	Feb 23, 2023	Adversarial TextImage Generation	—Unverified
Improving Adversarial Text Generation by Modeling the Distant Future	May 4, 2020	Adversarial TextImitation Learning	—Unverified
Improving Adversarial Text Generation with n-Gram Matching	Nov 1, 2021	Adversarial TextText Generation	—Unverified
Autonomous LLM-Enhanced Adversarial Attack for Text-to-Motion	Aug 1, 2024	Adversarial AttackAdversarial Text	—Unverified
Iterative Adversarial Attack on Image-guided Story Ending Generation	May 16, 2023	Adversarial AttackAdversarial Robustness	—Unverified
AdvCodec: Towards A Unified Framework for Adversarial Text Generation	Sep 25, 2019	Adversarial TextQuestion Answering	—Unverified
A survey on text generation using generative adversarial networks	Dec 20, 2022	Adversarial TextSurvey	—Unverified
Meta-CoTGAN: A Meta Cooperative Training Paradigm for Improving Adversarial Text Generation	Mar 12, 2020	Adversarial TextDiversity	—Unverified
“That Is a Suspicious Reaction!”: Interpreting Logits Variation to Detect NLP Adversarial Attacks	May 1, 2022	Adversarial Text	—Unverified

Show:10 25 50

← PrevPage 7 of 12Next →

No leaderboard results yet.