Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5376–5400 of 8378 papers

Title	Date	Tasks	Status
TextAttack: Lessons learned in designing Python frameworks for NLP	Nov 1, 2020	Adversarial AttackData Augmentation	—Unverified
Text Augmentation in a Multi-Task View	Jan 14, 2021	Data AugmentationText Augmentation	—Unverified
TextAug: Test time Text Augmentation for Multimodal Person Re-identification	Dec 4, 2023	Data AugmentationMultimodal Deep Learning	—Unverified
Text Classification by Contrastive Learning and Cross-lingual Data Augmentation for Alzheimer's Disease Detection	Dec 1, 2020	Alzheimer's Disease DetectionContrastive Learning	—Unverified
Text clustering applied to data augmentation in legal contexts	Apr 8, 2024	ClassificationClustering	—Unverified
Text Data Augmentation for Large Language Models: A Comprehensive Survey of Methods, Challenges, and Opportunities	Jan 31, 2025	Data AugmentationRetrieval	—Unverified
Synthetic Data Generation in Low-Resource Settings via Fine-Tuning of Large Language Models	Oct 2, 2023	Data AugmentationIn-Context Learning	—Unverified
Text Data Augmentation: Towards better detection of spear-phishing emails	Jul 4, 2020	Data AugmentationGeneral Classification	—Unverified
Text Detection on Technical Drawings for the Digitization of Brown-field Processes	May 5, 2022	Data Augmentationobject-detection	—Unverified
Text Generation with Speech Synthesis for ASR Data Augmentation	May 22, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Text Intimacy Analysis using Ensembles of Multilingual Transformers	Dec 5, 2023	Data Augmentation	—Unverified
TextMosaic: A New Data Augmentation Method for Named Entity Recognition Using Document-Level Contexts	Nov 16, 2021	Data AugmentationGPU	—Unverified
Text Smoothing: Enhance Various Data Augmentation Methods on Text Classification Tasks	Nov 16, 2021	Data AugmentationLanguage Modeling	—Unverified
Text-To-Speech Data Augmentation for Low Resource Speech Recognition	Apr 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Textual Augmentation Techniques Applied to Low Resource Machine Translation: Case of Swahili	Jun 12, 2023	Data AugmentationMachine Translation	—Unverified
Textual Data Augmentation for Efficient Active Learning on Tiny Datasets	Nov 1, 2020	Active LearningData Augmentation	—Unverified
Textual Data Augmentation for Patient Outcomes Prediction	Nov 13, 2022	Data AugmentationLanguage Modeling	—Unverified
Texture Synthesis Guided Deep Hashing for Texture Image Retrieval	Nov 4, 2018	Data AugmentationDeep Hashing	—Unverified
Thai Financial Domain Adaptation of THaLLE -- Technical Report	Nov 27, 2024	Data AugmentationDomain Adaptation	—Unverified
ThangDLU at #SMM4H 2024: Encoder-decoder models for classifying text data on social disorders in children and adolescents	Apr 30, 2024	Binary ClassificationClassification	—Unverified
That's So Annoying!!!: A Lexical and Frame-Semantic Embedding Based Data Augmentation Approach to Automatic Categorization of Annoying Behaviors using \#petpeeve Tweets	Sep 1, 2015	Data Augmentation	—Unverified
THDA: Treasure Hunt Data Augmentation for Semantic Navigation	Jan 1, 2021	Data AugmentationNavigate	—Unverified
The 2021 NIST Speaker Recognition Evaluation	Apr 21, 2022	Data AugmentationFace Recognition	—Unverified
The 2nd Place Solution from the 3D Semantic Segmentation Track in the 2024 Waymo Open Dataset Challenge	Jan 6, 2025	3D Semantic SegmentationAutonomous Vehicles	—Unverified
The 2ST-UNet for Pneumothorax Segmentation in Chest X-Rays using ResNet34 as a Backbone for U-Net	Sep 6, 2020	Data Augmentation	—Unverified

Show:10 25 50

← PrevPage 216 of 336Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified