Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2251–2300 of 8378 papers

Title	Date	Tasks	Status
Combining Weakly Supervised ML Techniques for Low-Resource NLU	Jun 1, 2021	Continual LearningData Augmentation	—Unverified
A Spatio-Temporal Neural Network Forecasting Approach for Emulation of Firefront Models	Jun 17, 2022	Data Augmentation	—Unverified
AFSC: Adaptive Fourier Space Compression for Anomaly Detection	Apr 17, 2022	Anomaly DetectionData Augmentation	—Unverified
Combining Transformer Generators with Convolutional Discriminators	May 21, 2021	Data AugmentationImage Generation	—Unverified
Combining Pyramid Pooling and Attention Mechanism for Pelvic MR Image Semantic Segmentaion	Jun 1, 2018	Data AugmentationImage Segmentation	—Unverified
A Span-based Model for Extracting Overlapping PICO Entities from RCT Publications	Jan 8, 2024	Data AugmentationPICO	—Unverified
Combining Noise-to-Image and Image-to-Image GANs: Brain MR Image Augmentation for Tumor Detection	May 31, 2019	Data AugmentationGeneral Classification	—Unverified
Combining Multi-Sequence and Synthetic Images for Improved Segmentation of Late Gadolinium Enhancement Cardiac MRI	Sep 3, 2019	Cardiac SegmentationData Augmentation	—Unverified
ASMR: Augmenting Life Scenario using Large Generative Models for Robotic Action Reflection	Jun 16, 2025	Data AugmentationLarge Language Model	—Unverified
A breakthrough in Speech emotion recognition using Deep Retinal Convolution Neural Networks	Jul 12, 2017	Data AugmentationEmotion Recognition	—Unverified
Domain-Agnostic Clustering with Self-Distillation	Nov 23, 2021	ClusteringData Augmentation	—Unverified
Combining Image Features and Patient Metadata to Enhance Transfer Learning	Oct 8, 2021	ClassificationData Augmentation	—Unverified
A Smartphone-Based Skin Disease Classification Using MobileNet CNN	Nov 13, 2019	ClassificationData Augmentation	—Unverified
Combining High-Level Features of Raw Audio Waves and Mel-Spectrograms for Audio Tagging	Nov 26, 2018	Audio TaggingData Augmentation	—Unverified
Combining Euclidean Alignment and Data Augmentation for BCI decoding	May 23, 2024	ClassificationData Augmentation	—Unverified
A Small Claims Court for the NLP: Judging Legal Text Classification Strategies With Small Datasets	Sep 9, 2024	Data AugmentationLanguage Modelling	—Unverified
AfriNames: Most ASR models "butcher" African Names	Jun 1, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Combining Ensembles and Data Augmentation can Harm your Calibration	Oct 19, 2020	Data Augmentation	—Unverified
Ask-n-Learn: Active Learning via Reliable Gradient Representations for Image Classification	Sep 30, 2020	Active LearningData Augmentation	—Unverified
A Free Lunch for Unsupervised Domain Adaptive Object Detection without Source Data	Dec 10, 2020	Data AugmentationDomain Adaptation	—Unverified
Combination of multiple neural networks using transfer learning and extensive geometric data augmentation for assessing cellularity scores in histopathology images	Nov 9, 2022	Data AugmentationTransfer Learning	—Unverified
PixCell: A generative foundation model for digital histopathology images	Jun 5, 2025	Cell SegmentationData Augmentation	—Unverified
Combination of Domain Knowledge and Deep Learning for Sentiment Analysis of Short and Informal Messages on Social Media	Feb 16, 2019	Data AugmentationNegation	—Unverified
Combating COVID-19 using Generative Adversarial Networks and Artificial Intelligence for Medical Images: A Scoping Review	May 15, 2022	COVID-19 DiagnosisData Augmentation	—Unverified
Color Variants Identification in Fashion e-commerce via Contrastive Self-Supervised Representation Learning	Apr 17, 2021	Data AugmentationRepresentation Learning	—Unverified
ColorUNet: A convolutional classification approach to colorization	Nov 7, 2018	ClassificationColorization	—Unverified
A Simplified Framework for Contrastive Learning for Node Representations	May 1, 2023	Contrastive LearningData Augmentation	—Unverified
A Framework for Supervised and Unsupervised Segmentation and Classification of Materials Microstructure Images	Feb 10, 2025	Data AugmentationSegmentation	—Unverified
Supervised Graph Contrastive Learning for Few-shot Node Classification	Mar 29, 2022	ClassificationContrastive Learning	—Unverified
Adapting Multilingual Models for Code-Mixed Translation using Back-to-Back Translation	Aug 17, 2021	Data AugmentationMachine Translation	—Unverified
ColMix -- A Simple Data Augmentation Framework to Improve Object Detector Performance and Robustness in Aerial Images	May 22, 2023	Data AugmentationObject	—Unverified
A Simple Strategy to Provable Invariance via Orbit Mapping	Sep 24, 2022	3D Point Cloud ClassificationComputational Efficiency	—Unverified
Learning Visual Robotic Control Efficiently with Contrastive Pre-training and Data Augmentation	Dec 14, 2020	Data Augmentationreinforcement-learning	—Unverified
Does Synthetic Data Make Large Language Models More Efficient?	Oct 11, 2023	Data AugmentationQuestion Generation	—Unverified
Does VLN Pretraining Work with Nonsensical or Irrelevant Instructions?	Nov 28, 2023	Data AugmentationTranslation	—Unverified
Domain-adaptive and Subgroup-specific Cascaded Temperature Regression for Out-of-distribution Calibration	Feb 14, 2024	Data Augmentationregression	—Unverified
Domain Disentanglement with Interpolative Data Augmentation for Dual-Target Cross-Domain Recommendation	Jul 26, 2023	Data AugmentationDisentanglement	—Unverified
Domain Generalized Recaptured Screen Image Identification Using SWIN Transformer	Jul 24, 2024	Data AugmentationDomain Generalization	—Unverified
IIITH-BUT system for IWSLT 2025 low-resource Bhojpuri to Hindi speech translation	Jun 5, 2025	Data AugmentationTranslation	—Unverified
Does Data Augmentation Lead to Positive Margin?	May 8, 2019	Data Augmentation	—Unverified
Cold Start Streaming Learning for Deep Networks	Nov 9, 2022	Data Augmentation	—Unverified
Does enhanced shape bias improve neural network robustness to common corruptions?	Apr 20, 2021	Data Augmentation	—Unverified
Cognitive Biases in Large Language Models for News Recommendation	Oct 3, 2024	Data AugmentationMisinformation	—Unverified
CoDo: Contrastive Learning with Downstream Background Invariance for Detection	May 10, 2022	Contrastive LearningData Augmentation	—Unverified
A Fourth Wave of Open Data? Exploring the Spectrum of Scenarios for Open Data and Generative AI	May 7, 2024	Data AugmentationLanguage Modelling	—Unverified
Code-Switching without Switching: Language Agnostic End-to-End Speech Translation	Oct 4, 2022	Data Augmentationspeech-recognition	—Unverified
Textual Data Augmentation for Arabic-English Code-Switching Speech Recognition	Jan 7, 2022	Data AugmentationLanguage Modeling	—Unverified
A benchmark of state-of-the-art sound event detection systems evaluated on synthetic soundscapes	Feb 3, 2022	Data AugmentationEvent Detection	—Unverified
Does equivariance matter at scale?	Oct 30, 2024	Data Augmentation	—Unverified
A Fourier Perspective on Model Robustness in Computer Vision	Jun 21, 2019	Data Augmentation	—Unverified

Show:10 25 50

← PrevPage 46 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified