Text Augmentation

You can read these blog posts to get an overview of the approaches.

A Visual Survey of Data Augmentation in NLP

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 97 papers

Title	Date	Tasks	Status
Augment, Drop & Swap: Improving Diversity in LLM Captions for Efficient Music-Text Representation Learning	Sep 17, 2024	DiversityRepresentation Learning	—Unverified
Augmenting emotion features in irony detection with Large language modeling	Apr 18, 2024	Language ModelingLanguage Modelling	—Unverified
Empirical Study of Text Augmentation on Social Media Text in Vietnamese	Oct 1, 2020	Text Augmentation	—Unverified
Enabling Classifiers to Make Judgements Explicitly Aligned with Human Values	Oct 14, 2022	ClassificationFew-Shot Learning	—Unverified
Entity Aware Syntax Tree Based Data Augmentation for Natural Language Understanding	Sep 6, 2022	Data AugmentationIntent Detection	—Unverified
Evaluation Metrics for Text Data Augmentation in NLP	Feb 9, 2024	Data AugmentationText Augmentation	—Unverified
ExplainableDetector: Exploring Transformer-based Language Modeling Approach for SMS Spam Detection with Explainability Analysis	May 12, 2024	Explainable artificial intelligenceExplainable Artificial Intelligence (XAI)	—Unverified
Augmenty: A Python Library for Structured Text Augmentation	Dec 9, 2023	Dependency Parsingnamed-entity-recognition	—Unverified
"Hinglish" Language -- Modeling a Messy Code-Mixed Language	Dec 30, 2019	Language ModelingLanguage Modelling	—Unverified
Improving Fast-slow Encoder based Transducer with Streaming Deliberation	Dec 15, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Advancing NLP Models with Strategic Text Augmentation: A Comprehensive Study of Augmentation Methods and Curriculum Strategies	Feb 14, 2024	Sentiment AnalysisText Augmentation	—Unverified
IndiText Boost: Text Augmentation for Low Resource India Languages	Jan 23, 2024	Data AugmentationMulti Class Text Classification	—Unverified
Iterative Mask Filling: An Effective Text Augmentation Method Using Masked Language Modeling	Jan 3, 2024	Data Augmentationfill-mask	—Unverified
Batch Aggregation: An Approach to Enhance Text Classification with Correlated Augmented Data	Apr 7, 2025	ClassificationText Augmentation	—Unverified
Boosting Event Extraction with Denoised Structure-to-Text Augmentation	May 16, 2023	Data AugmentationDeep Reinforcement Learning	—Unverified
LLMs vs Established Text Augmentation Techniques for Classification: When do the Benefits Outweight the Costs?	Aug 29, 2024	Data AugmentationText Augmentation	—Unverified
LLMvsSmall Model? Large Language Model Based Text Augmentation Enhanced Personality Detection Model	Mar 12, 2024	Contrastive LearningLanguage Modeling	—Unverified
Mitigating Data Imbalance for Software Vulnerability Assessment: Does Data Augmentation Help?	Jul 15, 2024	Data AugmentationText Augmentation	—Unverified
Back Translation Survey for Improving Text Augmentation	Feb 19, 2021	SentenceSurvey	—Unverified
Multimodal AI on Wound Images and Clinical Notes for Home Patient Referral	Jan 22, 2025	Text AugmentationTransfer Learning	—Unverified
Neural Data-to-Text Generation with LM-based Text Augmentation	Feb 6, 2021	Data-to-Text GenerationText Augmentation	—Unverified
On the Effectiveness of Neural Text Generation based Data Augmentation for Recognition of Morphologically Rich Speech	Jun 9, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Performance Improvement of Language-Queried Audio Source Separation Based on Caption Augmentation From Large Language Models for DCASE Challenge 2024 Task 9	Jun 17, 2024	Audio Source SeparationPrompt Engineering	—Unverified
Prediction of ICD Codes with Clinical BERT Embeddings and Text Augmentation with Label Balancing using MIMIC-III	Aug 24, 2020	AttributePrediction	—Unverified
Probabilistic Linguistic Knowledge and Token-level Text Augmentation	Jun 29, 2023	Text Augmentation	—Unverified

Show:10 25 50

← PrevPage 2 of 4Next →

No leaderboard results yet.