Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6851–6900 of 8378 papers

Title	Date	Tasks	Status
I Prefer not to Say: Protecting User Consent in Models with Optional Personal Data	Oct 25, 2022	Data AugmentationDecision Making	CodeCode Available
DocEmul: a Toolkit to Generate Structured Historical Documents	Oct 10, 2017	Data Augmentation	CodeCode Available
Can Synthetic Faces Undo the Damage of Dataset Bias to Face Recognition and Facial Landmark Detection?	Nov 19, 2018	Data AugmentationFace Model	CodeCode Available
In-Contextual Gender Bias Suppression for Large Language Models	Sep 13, 2023	counterfactualData Augmentation	CodeCode Available
Harnessing Data Augmentation to Quantify Uncertainty in the Early Estimation of Single-Photon Source Quality	Jun 22, 2023	Data Augmentation	CodeCode Available
Incipient Fault Detection in Power Distribution System: A Time-Frequency Embedded Deep Learning Based Approach	Feb 18, 2023	Data AugmentationFault Detection	CodeCode Available
IMSurReal Too: IMS in the Surface Realization Shared Task 2020	Dec 1, 2020	Data Augmentation	CodeCode Available
Improving the U-Net Configuration for Automated Delineation of Head and Neck Cancer on MRI	Jan 9, 2025	Data AugmentationSegmentation	CodeCode Available
Adversarial Graph Contrastive Learning with Information Regularization	Feb 14, 2022	Contrastive LearningData Augmentation	CodeCode Available
Improving the Training of Data-Efficient GANs via Quality Aware Dynamic Discriminator Rejection Sampling	Jan 1, 2025	Data Augmentation	CodeCode Available
DMix: Adaptive Distance-aware Interpolative Mixup	May 1, 2022	Data AugmentationDiversity	CodeCode Available
Improving the Robustness of Question Answering Systems to Question Paraphrasing	Jul 1, 2019	Data AugmentationQuestion Answering	CodeCode Available
Improving the Robustness of Dense Retrievers Against Typos via Multi-Positive Contrastive Learning	Mar 16, 2024	Contrastive LearningData Augmentation	CodeCode Available
Isometric Transformations for Image Augmentation in Mueller Matrix Polarimetry	Nov 12, 2024	Data AugmentationImage Augmentation	CodeCode Available
DLCRec: A Novel Approach for Managing Diversity in LLM-Based Recommender Systems	Aug 22, 2024	Data AugmentationDiversity	CodeCode Available
Singing Voice Separation Using a Deep Convolutional Neural Network Trained by Ideal Binary Mask and Cross Entropy	Dec 4, 2018	Data AugmentationGeneral Classification	CodeCode Available
You Only Need Half: Boosting Data Augmentation by Using Partial Content	May 5, 2024	Data Augmentation	CodeCode Available
Unsupervised hard Negative Augmentation for contrastive learning	Jan 5, 2024	Contrastive LearningData Augmentation	CodeCode Available
Improving Systematic Generalization Through Modularity and Augmentation	Feb 22, 2022	Data AugmentationGrounded language learning	CodeCode Available
DisturbLabel: Regularizing CNN on the Loss Layer	Apr 30, 2016	Data Augmentation	CodeCode Available
ARM: Augment-REINFORCE-Merge Gradient for Stochastic Binary Networks	Jul 30, 2018	Data AugmentationVariational Inference	CodeCode Available
Bringing Masked Autoencoders Explicit Contrastive Properties for Point Cloud Self-Supervised Learning	Jul 8, 2024	Contrastive LearningData Augmentation	CodeCode Available
Probabilistic Spatial Transformer Networks	Apr 7, 2020	Data AugmentationTime Series	CodeCode Available
Iterative Counterfactual Data Augmentation	Feb 25, 2025	counterfactualData Augmentation	CodeCode Available
Probabilistic Structural Latent Representation for Unsupervised Embedding	Jun 1, 2020	Data AugmentationImage Classification	CodeCode Available
Iterative Ensemble Training with Anti-Gradient Control for Mitigating Memorization in Diffusion Models	Jul 22, 2024	Data AugmentationMemorization	CodeCode Available
Probabilistic Structural Latent Representation for Unsupervised Embedding	Jun 22, 2020	Data Augmentation	CodeCode Available
Investigating Prior Knowledge for Challenging Chinese Machine Reading Comprehension	Apr 21, 2019	Data AugmentationLanguage Modelling	CodeCode Available
Iterative Pseudo-Labeling for Speech Recognition	May 19, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
ARIEL: Adversarial Graph Contrastive Learning	Aug 15, 2022	Contrastive LearningData Augmentation	CodeCode Available
Improving SSVEP BCI Spellers With Data Augmentation and Language Models	Dec 28, 2024	Brain Computer InterfaceData Augmentation	CodeCode Available
Improving Socratic Question Generation using Data Augmentation and Preference Optimization	Mar 1, 2024	Data AugmentationQuestion Generation	CodeCode Available
Improving Skeleton-based Action Recognition with Interactive Object Information	Jan 9, 2025	Action RecognitionData Augmentation	CodeCode Available
Probing the Robustness of Pre-trained Language Models for Entity Matching	Oct 1, 2022	Data AugmentationDomain Generalization	CodeCode Available
Distributional Data Augmentation Methods for Low Resource Language	Sep 9, 2023	Data AugmentationSynthetic Data Generation	CodeCode Available
BrightCookies at SemEval-2025 Task 9: Exploring Data Augmentation for Food Hazard Classification	Apr 29, 2025	Data AugmentationText Augmentation	CodeCode Available
Improving singing voice separation with the Wave-U-Net using Minimum Hyperspherical Energy	Oct 22, 2019	Data Augmentationimage-classification	CodeCode Available
IUST at ClimateActivism 2024: Towards Optimal Stance Detection: A Systematic Study of Architectural Choices and Data Cleaning Techniques	Mar 22, 2024	Data AugmentationStance Detection	CodeCode Available
Bridging the Gaps: Utilizing Unlabeled Face Recognition Datasets to Boost Semi-Supervised Facial Expression Recognition	Oct 23, 2024	Data AugmentationFace Recognition	CodeCode Available
Transfer learning and subword sampling for asymmetric-resource one-to-many neural translation	Apr 8, 2020	Data AugmentationDenoising	CodeCode Available
Single-stage uav detection and classification with yolov5: Mosaic data augmentation and panet	Nov 16, 2021	2D Object DetectionData Augmentation	CodeCode Available
Transfer Learning and the Early Estimation of Single-Photon Source Quality using Machine Learning Methods	Aug 21, 2024	Data AugmentationFeature Engineering	CodeCode Available
Transfer Learning for Low-Resource Sentiment Analysis	Apr 10, 2023	Data AugmentationSentiment Analysis	CodeCode Available
Distinguishing rule- and exemplar-based generalization in learning systems	Oct 8, 2021	BIG-bench Machine LearningData Augmentation	CodeCode Available
Distinguishing Non-natural from Natural Adversarial Samples for More Robust Pre-trained Language Model	Mar 19, 2022	Data AugmentationLanguage Modeling	CodeCode Available
JoB-VS: Joint Brain-Vessel Segmentation in TOF-MRA Images	Apr 16, 2023	Data AugmentationSegmentation	CodeCode Available
Progressive Fusion for Unsupervised Binocular Depth Estimation using Cycled Networks	Sep 17, 2019	Data AugmentationDepth Estimation	CodeCode Available
Improving satellite imagery segmentation using multiple Sentinel-2 revisits	Sep 25, 2024	Data AugmentationDensity Estimation	CodeCode Available
The Effectiveness of Data Augmentation in Image Classification using Deep Learning	Dec 13, 2017	Data AugmentationGeneral Classification	CodeCode Available
Distillation Learning Guided by Image Reconstruction for One-Shot Medical Image Segmentation	Aug 7, 2024	Data AugmentationImage Reconstruction	CodeCode Available

Show:10 25 50

← PrevPage 138 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified