Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8251–8300 of 8378 papers

Title	Date	Tasks	Status
EdaCSC: Two Easy Data Augmentation Methods for Chinese Spelling Correction	Sep 8, 2024	Data AugmentationSpelling Correction	CodeCode Available
Traffic Sign Recognition Dataset and Data Augmentation	Mar 31, 2023	Data AugmentationTraffic Sign Recognition	CodeCode Available
Asynchronous Graph Generator	Sep 29, 2023	Data AugmentationGraph Attention	CodeCode Available
Temporal Convolutional Memory Networks for Remaining Useful Life Estimation of Industrial Machinery	Oct 12, 2018	Data Augmentation	CodeCode Available
PeerDA: Data Augmentation via Modeling Peer Relation for Span Identification Tasks	Oct 17, 2022	Data AugmentationRelation	CodeCode Available
CATfOOD: Counterfactual Augmented Training for Improving Out-of-Domain Performance and Calibration	Sep 14, 2023	counterfactualData Augmentation	CodeCode Available
One-shot Generative Distribution Matching for Augmented RF-based UAV Identification	Jan 20, 2023	Data Augmentation	CodeCode Available
People Make Better Edits: Measuring the Efficacy of LLM-Generated Counterfactually Augmented Data for Harmful Language Detection	Nov 2, 2023	Data Augmentation	CodeCode Available
PEPL: Precision-Enhanced Pseudo-Labeling for Fine-Grained Image Classification in Semi-Supervised Learning	Sep 5, 2024	Data AugmentationFine-Grained Image Classification	CodeCode Available
Case-Base Neural Networks: survival analysis with time-varying, higher-order interactions	Jan 16, 2023	Data Augmentationregression	CodeCode Available
Echo-E^3Net: Efficient Endo-Epi Spatio-Temporal Network for Ejection Fraction Estimation	Mar 21, 2025	Data AugmentationRepresentation Learning	CodeCode Available
ECAP: Extensive Cut-and-Paste Augmentation for Unsupervised Domain Adaptive Semantic Segmentation	Mar 6, 2024	Data AugmentationDomain Adaptation	CodeCode Available
Asynchronous and Distributed Data Augmentation for Massive Data Settings	Sep 18, 2021	Bayesian InferenceData Augmentation	CodeCode Available
Performance of GAN-based augmentation for deep learning COVID-19 image classification	Apr 18, 2023	Data AugmentationImage Augmentation	CodeCode Available
Sequence-to-Sequence Data Augmentation for Dialogue Language Understanding	Jul 4, 2018	Data AugmentationDiversity	CodeCode Available
Action Sequence Augmentation for Early Graph-based Anomaly Detection	Oct 20, 2020	Anomaly DetectionData Augmentation	CodeCode Available
Persian Emotion Detection using ParsBERT and Imbalanced Data Handling Approaches	Nov 15, 2022	Data AugmentationEmotion Recognition	CodeCode Available
Temporal Supervised Contrastive Learning for Modeling Patient Risk Progression	Dec 10, 2023	Contrastive LearningData Augmentation	CodeCode Available
Learning unfolded networks with a cyclic group structure	Nov 16, 2022	Data AugmentationRotated MNIST	CodeCode Available
A Survey on Deep Learning of Small Sample in Biomedical Image Analysis	Aug 1, 2019	Active LearningData Augmentation	CodeCode Available
Improving Sequential Recommendations via Bidirectional Temporal Data Augmentation with Pre-training	Dec 13, 2021	Data AugmentationKnowledge Distillation	CodeCode Available
Cascading Hierarchical Networks with Multi-task Balanced Loss for Fine-grained hashing	Mar 20, 2023	Data AugmentationFine-Grained Image Classification	CodeCode Available
Weighted Automata Extraction and Explanation of Recurrent Neural Networks for Natural Language Tasks	Jun 24, 2023	Data AugmentationModel extraction	CodeCode Available
A Modular System for Enhanced Robustness of Multimedia Understanding Networks via Deep Parametric Estimation	Feb 28, 2024	Data AugmentationDomain Adaptation	CodeCode Available
Cascade Bagging for Accuracy Prediction with Few Training Samples	Aug 12, 2021	Data AugmentationEnsemble Learning	CodeCode Available
Perturb, Predict & Paraphrase: Semi-Supervised Learning using Noisy Student for Image Captioning	Aug 19, 2021	Data AugmentationImage Augmentation	CodeCode Available
A Survey of Data Synthesis Approaches	Jul 4, 2024	Data AugmentationDiversity	CodeCode Available
Adaptive Data Augmentation for Aspect Sentiment Quad Prediction	Jan 12, 2024	Aspect-Based Sentiment AnalysisData Augmentation	CodeCode Available
E2TP: Element to Tuple Prompting Improves Aspect Sentiment Tuple Prediction	May 10, 2024	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available
CardiacGen: A Hierarchical Deep Generative Model for Cardiac Signals	Nov 15, 2022	Data AugmentationDeep Learning	CodeCode Available
PGCS: Physical Law embedded Generative Cloud Synthesis in Remote Sensing Images	Oct 22, 2024	Cloud DetectionData Augmentation	CodeCode Available
Tensor feature hallucination for few-shot learning	Jun 9, 2021	Data AugmentationFew-Shot Learning	CodeCode Available
Astraea: Self-balancing Federated Learning for Improving Classification Accuracy of Mobile Deep Learning Applications	Jul 2, 2019	Data AugmentationEdge-computing	CodeCode Available
Dynamic Data Augmentation via MCTS for Prostate MRI Segmentation	May 25, 2023	Data AugmentationGPU	CodeCode Available
PHICON: Improving Generalization of Clinical Text De-identification Models via Data Augmentation	Oct 11, 2020	Data AugmentationDe-identification	CodeCode Available
Adapting Video Diffusion Models for Time-Lapse Microscopy	Mar 24, 2025	Data AugmentationDomain Adaptation	CodeCode Available
Term Expansion and FinBERT fine-tuning for Hypernym and Synonym Ranking of Financial Terms	Jul 29, 2021	Data AugmentationSemantic Similarity	CodeCode Available
CapsuleNet: A Deep Learning Model To Classify GI Diseases Using EfficientNet-b7	Oct 24, 2024	Data AugmentationDiagnostic	CodeCode Available
Training Data Augmentation for Code-Mixed Translation	Jun 1, 2021	Data AugmentationMachine Translation	CodeCode Available
Can We Break Free from Strong Data Augmentations in Self-Supervised Learning?	Apr 15, 2024	Data AugmentationSelf-Supervised Learning	CodeCode Available
Can We Achieve More with Less? Exploring Data Augmentation for Toxic Comment Classification	Jul 2, 2020	BIG-bench Machine LearningData Augmentation	CodeCode Available
Dual-Perspective Knowledge Enrichment for Semi-Supervised 3D Object Detection	Jan 10, 2024	3D Object DetectionData Augmentation	CodeCode Available
DualMatch: Robust Semi-Supervised Learning with Dual-Level Interaction	Oct 25, 2023	Data Augmentation	CodeCode Available
Training Data Augmentation for Context-Sensitive Neural Lemmatizer Using Inflection Tables and Raw Text	Jun 1, 2019	Data AugmentationLEMMA	CodeCode Available
Unsupervised Contrastive Analysis for Salient Pattern Detection using Conditional Diffusion Models	Jun 2, 2024	Contrastive LearningData Augmentation	CodeCode Available
Testing and Improving the Robustness of Amortized Bayesian Inference for Cognitive Models	Dec 29, 2024	Bayesian InferenceData Augmentation	CodeCode Available
Shape-aware synthesis of pathological lung CT scans using CycleGAN for enhanced semi-supervised lung segmentation	May 14, 2024	Data AugmentationImage Segmentation	CodeCode Available
Weighted Contrastive Hashing	Sep 28, 2022	Contrastive LearningData Augmentation	CodeCode Available
Weighted Cross-entropy for Low-Resource Languages in Multilingual Speech Recognition	Sep 25, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Dual encoding feature filtering generalized attention UNET for retinal vessel segmentation	Jun 2, 2025	Data AugmentationRetinal Vessel Segmentation	CodeCode Available

Show:10 25 50

← PrevPage 166 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified