SOTAVerified|Agents Browse Leaderboard About

Adversarial Text

Adversarial Text refers to a specialised text sequence that is designed specifically to influence the prediction of a language model. Generally, Adversarial Text attack are carried out on Large Language Models (LLMs). Research on understanding different adversarial approaches can help us build effective defense mechanisms to detect malicious text input and build robust language models.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 91–100 of 114 papers

Title	Date	Tasks	Status
Towards Imperceptible Document Manipulations against Neural Ranking Models	May 3, 2023	Adversarial TextLanguage Modeling	—Unverified
What Machines See Is Not What They Get: Fooling Scene Text Recognition Models With Adversarial Text Images	Jun 1, 2020	Adversarial AttackAdversarial Text	—Unverified
Universal Adversarial Perturbation for Text Classification	Oct 10, 2019	Adversarial TextClassification	—Unverified
Graded Suspiciousness of Adversarial Texts to Human	Oct 6, 2024	Adversarial AttackAdversarial Text	—Unverified
Adversarial Text Generation with Dynamic Contextual Perturbation	Jun 10, 2025	Adversarial TextText Generation	—Unverified
What Models Know About Their Attackers: Deriving Attacker Information From Latent Representations	Nov 1, 2021	Abuse DetectionAdversarial Text	—Unverified
Target-driven Attack for Large Language Models	Nov 9, 2024	Adversarial TextLanguage Modeling	—Unverified
Adversarial Text Generation via Sequence Contrast Discrimination	Nov 1, 2020	Adversarial TextText Generation	—Unverified
Detecting Adversarial Text Attacks via SHapley Additive exPlanations	May 16, 2021	Adversarial TextSST-2	—Unverified
Detecting Word-Level Adversarial Text Attacks via SHapley Additive exPlanations	May 1, 2022	Adversarial Text	—Unverified

Show:10 25 50

← PrevPage 10 of 12Next →

No leaderboard results yet.