Adversarial Text

Adversarial Text refers to a specialised text sequence that is designed specifically to influence the prediction of a language model. Generally, Adversarial Text attack are carried out on Large Language Models (LLMs). Research on understanding different adversarial approaches can help us build effective defense mechanisms to detect malicious text input and build robust language models.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 114 papers

Title	Date	Tasks	Status	Hype
Adversarial Text Generation with Dynamic Contextual Perturbation	Jun 10, 2025	Adversarial TextText Generation	—Unverified	0
StealthRank: LLM Ranking Manipulation via Stealthy Prompt Optimization	Apr 8, 2025	Adversarial TextInformation Retrieval	CodeCode Available	0
Breaking BERT: Gradient Attack on Twitter Sentiment Analysis for Targeted Misclassification	Apr 2, 2025	Adversarial TextSentiment Analysis	CodeCode Available	0
A Grey-box Text Attack Framework using Explainable AI	Mar 11, 2025	Adversarial TextData Augmentation	—Unverified	0
Continuous Adversarial Text Representation Learning for Affective Recognition	Feb 28, 2025	Adversarial TextContrastive Learning	—Unverified	0
SMAB: MAB based word Sensitivity Estimation Framework and its Applications in Adversarial Text Generation	Feb 10, 2025	Adversarial TextParaphrase Generation	CodeCode Available	0
Hierarchical Lexical Manifold Projection in Large Language Models: A Novel Mechanism for Multi-Scale Semantic Representation	Feb 8, 2025	Adversarial TextComputational Efficiency	—Unverified	0
EMPRA: Embedding Perturbation Rank Attack against Neural Ranking Models	Dec 20, 2024	Adversarial TextInformation Retrieval	CodeCode Available	0
Finding a Wolf in Sheep's Clothing: Combating Adversarial Text-To-Image Prompts with Text Summarization	Dec 15, 2024	Adversarial TextBinary Classification	—Unverified	0
BinarySelect to Improve Accessibility of Black-Box Attack Research	Dec 13, 2024	Adversarial Text	CodeCode Available	0
PBI-Attack: Prior-Guided Bimodal Interactive Black-Box Jailbreak Attack for Toxicity Maximization	Dec 8, 2024	Adversarial TextPrompt Engineering	—Unverified	0
TSCheater: Generating High-Quality Tibetan Adversarial Texts via Visual Similarity	Dec 3, 2024	Adversarial RobustnessAdversarial Text	CodeCode Available	0
SceneTAP: Scene-Coherent Typographic Adversarial Planner against Vision-Language Models in Real-World Environments	Nov 28, 2024	Adversarial TextScene Understanding	—Unverified	0
NMT-Obfuscator Attack: Ignore a sentence in translation with only one word	Nov 19, 2024	Adversarial AttackAdversarial Text	CodeCode Available	0
IAE: Irony-based Adversarial Examples for Sentiment Analysis Systems	Nov 12, 2024	Adversarial TextSentiment Analysis	—Unverified	0
Target-driven Attack for Large Language Models	Nov 9, 2024	Adversarial TextLanguage Modeling	—Unverified	0
AdvI2I: Adversarial Image Attack on Image-to-Image Diffusion models	Oct 28, 2024	Adversarial TextImage Generation	CodeCode Available	1
Graded Suspiciousness of Adversarial Texts to Human	Oct 6, 2024	Adversarial AttackAdversarial Text	—Unverified	0
Adversarial Decoding: Generating Readable Documents for Adversarial Objectives	Oct 3, 2024	Adversarial TextRAG	CodeCode Available	1
Vision-fused Attack: Advancing Aggressive and Stealthy Adversarial Text against Neural Machine Translation	Sep 8, 2024	Adversarial TextMachine Translation	CodeCode Available	0
OpenFact at CheckThat! 2024: Combining Multiple Attack Methods for Effective Adversarial Text Generation	Sep 4, 2024	Adversarial AttackAdversarial Text	—Unverified	0
Adversarial Text Rewriting for Text-aware Recommender Systems	Aug 1, 2024	Adversarial TextIn-Context Learning	CodeCode Available	1
Autonomous LLM-Enhanced Adversarial Attack for Text-to-Motion	Aug 1, 2024	Adversarial AttackAdversarial Text	—Unverified	0
Enhancing Adversarial Text Attacks on BERT Models with Projected Gradient Descent	Jul 29, 2024	Adversarial TextSemantic Similarity	—Unverified	0
Dissecting Adversarial Robustness of Multimodal LM Agents	Jun 18, 2024	Adversarial RobustnessAdversarial Text	CodeCode Available	2

Show:10 25 50

← PrevPage 1 of 5Next →

No leaderboard results yet.