SOTAVerified|Agents Browse Leaderboard About

Adversarial Text

Adversarial Text refers to a specialised text sequence that is designed specifically to influence the prediction of a language model. Generally, Adversarial Text attack are carried out on Large Language Models (LLMs). Research on understanding different adversarial approaches can help us build effective defense mechanisms to detect malicious text input and build robust language models.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–10 of 114 papers

Title	Date	Tasks	Status	Hype
RETSim: Resilient and Efficient Text Similarity	Nov 28, 2023	Adversarial TextClustering	CodeCode Available	4
Ignore Previous Prompt: Attack Techniques For Language Models	Nov 17, 2022	Adversarial AttackAdversarial Text	CodeCode Available	2
BAE: BERT-based Adversarial Examples for Text Classification	Apr 4, 2020	Adversarial AttackAdversarial Text	CodeCode Available	2
Searching for a Search Method: Benchmarking Search Algorithms for Generating NLP Adversarial Examples	Sep 9, 2020	Adversarial TextBenchmarking	CodeCode Available	2
RETVec: Resilient and Efficient Text Vectorizer	Feb 18, 2023	Adversarial TextMetric Learning	CodeCode Available	2
Dissecting Adversarial Robustness of Multimodal LM Agents	Jun 18, 2024	Adversarial RobustnessAdversarial Text	CodeCode Available	2
TextAttack: A Framework for Adversarial Attacks, Data Augmentation, and Adversarial Training in NLP	Apr 29, 2020	Adversarial AttackAdversarial Text	CodeCode Available	2
T3: Tree-Autoencoder Constrained Adversarial Text Generation for Targeted Attack	Dec 22, 2019	Adversarial AttackAdversarial Text	CodeCode Available	1
Adversarial Text Rewriting for Text-aware Recommender Systems	Aug 1, 2024	Adversarial TextIn-Context Learning	CodeCode Available	1
Black-box Generation of Adversarial Text Sequences to Evade Deep Learning Classifiers	Jan 13, 2018	Adversarial TextGeneral Classification	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 12Next →

No leaderboard results yet.