Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7451–7500 of 8378 papers

Title	Date	Tasks	Status
GeoMix: Towards Geometry-Aware Data Augmentation	Jul 15, 2024	Data AugmentationGraph Learning	CodeCode Available
Generative Style Transfer for MRI Image Segmentation: A Case of Glioma Segmentation in Sub-Saharan Africa	Jan 7, 2025	Brain Tumor SegmentationData Augmentation	CodeCode Available
A Geometry-Sensitive Approach for Photographic Style Classification	Sep 3, 2019	ClassificationData Augmentation	CodeCode Available
Type-Driven Multi-Turn Corrections for Grammatical Error Correction	Mar 17, 2022	Data AugmentationGrammatical Error Correction	CodeCode Available
BDA: Bangla Text Data Augmentation Framework	Dec 11, 2024	Data Augmentationtext-classification	CodeCode Available
Together We Can: Multilingual Automatic Post-Editing for Low-Resource Languages	Oct 23, 2024	Automatic Post-EditingData Augmentation	CodeCode Available
Maximum Bayes Smatch Ensemble Distillation for AMR Parsing	Dec 14, 2021	AMR ParsingData Augmentation	CodeCode Available
Statistical Depth for Ranking and Characterizing Transformer-Based Text Embeddings	Oct 23, 2023	Data AugmentationIn-Context Learning	CodeCode Available
Generative Modeling Helps Weak Supervision (and Vice Versa)	Mar 22, 2022	Data Augmentationimage-classification	CodeCode Available
PhiNet v2: A Mask-Free Brain-Inspired Vision Foundation Model from Video	May 16, 2025	Data AugmentationSelf-Supervised Learning	CodeCode Available
Maximum Total Correlation Reinforcement Learning	May 22, 2025	Data AugmentationInductive Bias	CodeCode Available
Generative Modeling and Data Augmentation for Power System Production Simulation	Dec 10, 2024	Data AugmentationLoad Forecasting	CodeCode Available
Return of the Devil in the Details: Delving Deep into Convolutional Nets	May 14, 2014	Data Augmentationobject-detection	CodeCode Available
Generative Model-Driven Synthetic Training Image Generation: An Approach to Cognition in Rail Defect Detection	Dec 31, 2023	Data AugmentationDefect Detection	CodeCode Available
A Parameterized Generative Adversarial Network Using Cyclic Projection for Explainable Medical Image Classification	Nov 24, 2023	Data AugmentationGenerative Adversarial Network	CodeCode Available
MDMLP: Image Classification from Scratch on Small Datasets with MLP	May 28, 2022	Data Augmentationimage-classification	CodeCode Available
A Novel Feature Space Augmentation Method to Improve Classification Performance and Evaluation Reliability	Aug 24, 2024	Binary ClassificationData Augmentation	CodeCode Available
Data Augmentation Techniques for Cross-Domain WiFi CSI-based Human Activity Recognition	Jan 1, 2024	Activity RecognitionData Augmentation	CodeCode Available
Reverse Operation based Data Augmentation for Solving Math Word Problems	Oct 4, 2020	Data AugmentationMath	CodeCode Available
A Dual-Contrastive Framework for Low-Resource Cross-Lingual Named Entity Recognition	Apr 2, 2022	Contrastive LearningCross-Lingual NER	CodeCode Available
Data Augmentation Techniques for Chinese Disease Name Normalization	Jan 2, 2025	Data Augmentation	CodeCode Available
Measuring the Robustness of Audio Deepfake Detectors	Mar 21, 2025	Audio Deepfake DetectionData Augmentation	CodeCode Available
Generative Image Translation for Data Augmentation in Colorectal Histopathology Images	Oct 13, 2019	Data Augmentationimage-classification	CodeCode Available
ScribbleGen: Generative Data Augmentation Improves Scribble-supervised Semantic Segmentation	Nov 28, 2023	Data Augmentationimage-classification	CodeCode Available
Data augmentation on-the-fly and active learning in data stream classification	Oct 13, 2022	Active LearningData Augmentation	CodeCode Available
MediAug: Exploring Visual Augmentation in Medical Imaging	Apr 26, 2025	Brain Tumor ClassificationData Augmentation	CodeCode Available
BCH-NLP at BioCreative VII Track 3: medications detection in tweets using transformer networks and multi-task learning	Nov 26, 2021	AllData Augmentation	CodeCode Available
Medical Image Segmentation Using Deep Learning: A Survey	Sep 28, 2020	Data AugmentationDeep Learning	CodeCode Available
Medical Image Segmentation via Single-Source Domain Generalization with Random Amplitude Spectrum Synthesis	Sep 7, 2024	Data AugmentationDomain Generalization	CodeCode Available
Revisiting Cross-Modal Knowledge Distillation: A Disentanglement Approach for RGBD Semantic Segmentation	May 30, 2025	Autonomous DrivingContrastive Learning	CodeCode Available
Steganographic Embeddings as an Effective Data Augmentation	Feb 21, 2025	Data Augmentationimage-classification	CodeCode Available
BSDA: Bayesian Random Semantic Data Augmentation for Medical Image Classification	Mar 10, 2024	Data AugmentationDiversity	CodeCode Available
Revisiting Data Augmentation for Ultrasound Images	Jan 22, 2025	Data Augmentationimage-classification	CodeCode Available
Revisiting Data Augmentation in Deep Reinforcement Learning	Feb 19, 2024	Data AugmentationDeep Reinforcement Learning	CodeCode Available
Bayesian Neural Network Language Modeling for Speech Recognition	Aug 28, 2022	Data AugmentationLanguage Modeling	CodeCode Available
MedMine: Examining Pre-trained Language Models on Medication Mining	Aug 7, 2023	Data AugmentationEnsemble Learning	CodeCode Available
Generative-Contrastive Heterogeneous Graph Neural Network	Apr 3, 2024	Contrastive LearningData Augmentation	CodeCode Available
MedRep: Medical Concept Representation for General Electronic Health Record Foundation Models	Apr 11, 2025	Data AugmentationLanguage Modeling	CodeCode Available
Bayesian Data Augmentation and Training for Perception DNN in Autonomous Aerial Vehicles	Dec 10, 2024	Autonomous VehiclesBayesian Optimization	CodeCode Available
Generative AI-Powered Plugin for Robust Federated Learning in Heterogeneous IoT Networks	Oct 31, 2024	Data AugmentationFederated Learning	CodeCode Available
Balanced Split: A new train-test data splitting strategy for imbalanced datasets	Dec 17, 2022	Data AugmentationEnsemble Learning	CodeCode Available
TopGuNN: Fast NLP Training Data Augmentation using Large Corpora	Jun 1, 2021	Data AugmentationRetrieval	CodeCode Available
Generative AI for Data Augmentation in Wireless Networks: Analysis, Applications, and Case Study	Nov 13, 2024	Data AugmentationGesture Recognition	CodeCode Available
How Does Data Augmentation Affect Privacy in Machine Learning?	Jul 21, 2020	BIG-bench Machine LearningData Augmentation	CodeCode Available
Balanced and Explainable Social Media Analysis for Public Health with Large Language Models	Sep 12, 2023	Data AugmentationDecision Making	CodeCode Available
Revisiting Knowledge Distillation under Distribution Shift	Dec 25, 2023	Data AugmentationDiversity	CodeCode Available
Generative Adversarial Network with Spatial Attention for Face Attribute Editing	Sep 1, 2018	AttributeData Augmentation	CodeCode Available
Data augmentation on graphs for table type classification	Aug 23, 2022	ClassificationData Augmentation	CodeCode Available
A Comparative Study of Pre-training and Self-training	Sep 4, 2024	Data AugmentationNatural Language Inference	CodeCode Available
A Comparative Study of Graph Neural Networks for Shape Classification in Neuroimaging	Oct 29, 2022	ClassificationData Augmentation	CodeCode Available

Show:10 25 50

← PrevPage 150 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified