Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5351–5400 of 8378 papers

Title	Date	Tasks	Status
TEAM-Atreides at SemEval-2022 Task 11: On leveraging data augmentation and ensemble to recognize complex Named Entities in Bangla	Apr 21, 2022	Data Augmentation	—Unverified
Team DoNotDistribute at SemEval-2020 Task 11: Features, Finetuning, and Data Augmentation in Neural Models for Propaganda Detection in News Articles	Aug 21, 2020	ArticlesData Augmentation	—Unverified
Team HYU ASML ROBOVOX SP Cup 2024 System Description	Jul 16, 2024	Data AugmentationSpeaker Recognition	—Unverified
Team JUST at the MADAR Shared Task on Arabic Fine-Grained Dialect Identification	Aug 1, 2019	Data AugmentationDialect Identification	—Unverified
Team “NoConflict” at CASE 2021 Task 1: Pretraining for Sentence-Level Protest Event Detection	Aug 1, 2021	ArticlesData Augmentation	—Unverified
Team Samsung-RAL: Technical Report for 2024 RoboDrive Challenge-Robust Map Segmentation Track	May 17, 2024	Autonomous DrivingData Augmentation	—Unverified
Technical report on Conversational Question Answering	Sep 24, 2019	Conversational Question AnsweringData Augmentation	—Unverified
Technical Report on Shared Task in DialDoc21	Aug 1, 2021	Data Augmentation	—Unverified
Technical report on target classification in SAR track	May 3, 2024	ClassificationData Augmentation	—Unverified
Telephonetic: Making Neural Language Models Robust to ASR and Semantic Noise	Jun 13, 2019	Data AugmentationDecoder	—Unverified
TeLL Me what you cant see	Mar 25, 2025	Data AugmentationPerson Re-Identification	—Unverified
Temporal-Clustering Invariance in Irregular Healthcare Time Series	Apr 27, 2019	ClusteringData Augmentation	—Unverified
Temporal Variability and Multi-Viewed Self-Supervised Representations to Tackle the ASVspoof5 Deepfake Challenge	Aug 13, 2024	Audio Deepfake DetectionData Augmentation	—Unverified
Tencent Neural Machine Translation Systems for WMT18	Oct 1, 2018	Data AugmentationMachine Translation	—Unverified
Tencent Neural Machine Translation Systems for the WMT20 News Translation Task	Nov 1, 2020	Data AugmentationMachine Translation	—Unverified
Tencent Translation System for the WMT21 News Translation Task	Nov 1, 2021	Data AugmentationTranslation	—Unverified
Terabyte-scale supervised 3D training and benchmarking dataset of the mouse kidney	Aug 4, 2021	BenchmarkingBIG-bench Machine Learning	—Unverified
TermMind: Alibaba’s WMT21 Machine Translation Using Terminologies Task Submission	Nov 1, 2021	Data AugmentationMachine Translation	—Unverified
Tertiary Lymphoid Structures Generation through Graph-based Diffusion	Oct 10, 2023	Data Augmentation	—Unverified
Tesla at SemEval-2022 Task 4: Patronizing and Condescending Language Detection using Transformer-based Models with Data Augmentation	Jul 1, 2022	ClassificationData Augmentation	—Unverified
Test-Time Augmentation for 3D Point Cloud Classification and Segmentation	Nov 22, 2023	3D Point Cloud ClassificationData Augmentation	—Unverified
Test-Time Augmentation Meets Variational Bayes	Sep 19, 2024	Data Augmentation	—Unverified
Test-time image-to-image translation ensembling improves out-of-distribution generalization in histopathology	Jun 20, 2022	ArticlesData Augmentation	—Unverified
Test-time Training for Hyperspectral Image Super-resolution	Sep 13, 2024	Data AugmentationHyperspectral Image Super-Resolution	—Unverified
Text2CT: Towards 3D CT Volume Generation from Free-text Descriptions Using Diffusion Model	May 7, 2025	Data AugmentationDescriptive	—Unverified
TextAttack: Lessons learned in designing Python frameworks for NLP	Nov 1, 2020	Adversarial AttackData Augmentation	—Unverified
Text Augmentation in a Multi-Task View	Jan 14, 2021	Data AugmentationText Augmentation	—Unverified
TextAug: Test time Text Augmentation for Multimodal Person Re-identification	Dec 4, 2023	Data AugmentationMultimodal Deep Learning	—Unverified
Text Classification by Contrastive Learning and Cross-lingual Data Augmentation for Alzheimer's Disease Detection	Dec 1, 2020	Alzheimer's Disease DetectionContrastive Learning	—Unverified
Text clustering applied to data augmentation in legal contexts	Apr 8, 2024	ClassificationClustering	—Unverified
Text Data Augmentation for Large Language Models: A Comprehensive Survey of Methods, Challenges, and Opportunities	Jan 31, 2025	Data AugmentationRetrieval	—Unverified
Synthetic Data Generation in Low-Resource Settings via Fine-Tuning of Large Language Models	Oct 2, 2023	Data AugmentationIn-Context Learning	—Unverified
Text Data Augmentation: Towards better detection of spear-phishing emails	Jul 4, 2020	Data AugmentationGeneral Classification	—Unverified
Text Detection on Technical Drawings for the Digitization of Brown-field Processes	May 5, 2022	Data Augmentationobject-detection	—Unverified
Text Generation with Speech Synthesis for ASR Data Augmentation	May 22, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Text Intimacy Analysis using Ensembles of Multilingual Transformers	Dec 5, 2023	Data Augmentation	—Unverified
TextMosaic: A New Data Augmentation Method for Named Entity Recognition Using Document-Level Contexts	Nov 16, 2021	Data AugmentationGPU	—Unverified
Text Smoothing: Enhance Various Data Augmentation Methods on Text Classification Tasks	Nov 16, 2021	Data AugmentationLanguage Modeling	—Unverified
Text-To-Speech Data Augmentation for Low Resource Speech Recognition	Apr 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Textual Augmentation Techniques Applied to Low Resource Machine Translation: Case of Swahili	Jun 12, 2023	Data AugmentationMachine Translation	—Unverified
Textual Data Augmentation for Efficient Active Learning on Tiny Datasets	Nov 1, 2020	Active LearningData Augmentation	—Unverified
Textual Data Augmentation for Patient Outcomes Prediction	Nov 13, 2022	Data AugmentationLanguage Modeling	—Unverified
Texture Synthesis Guided Deep Hashing for Texture Image Retrieval	Nov 4, 2018	Data AugmentationDeep Hashing	—Unverified
Thai Financial Domain Adaptation of THaLLE -- Technical Report	Nov 27, 2024	Data AugmentationDomain Adaptation	—Unverified
ThangDLU at #SMM4H 2024: Encoder-decoder models for classifying text data on social disorders in children and adolescents	Apr 30, 2024	Binary ClassificationClassification	—Unverified
That's So Annoying!!!: A Lexical and Frame-Semantic Embedding Based Data Augmentation Approach to Automatic Categorization of Annoying Behaviors using \#petpeeve Tweets	Sep 1, 2015	Data Augmentation	—Unverified
THDA: Treasure Hunt Data Augmentation for Semantic Navigation	Jan 1, 2021	Data AugmentationNavigate	—Unverified
The 2021 NIST Speaker Recognition Evaluation	Apr 21, 2022	Data AugmentationFace Recognition	—Unverified
The 2nd Place Solution from the 3D Semantic Segmentation Track in the 2024 Waymo Open Dataset Challenge	Jan 6, 2025	3D Semantic SegmentationAutonomous Vehicles	—Unverified
The 2ST-UNet for Pneumothorax Segmentation in Chest X-Rays using ResNet34 as a Backbone for U-Net	Sep 6, 2020	Data Augmentation	—Unverified

Show:10 25 50

← PrevPage 108 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified