Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8151–8200 of 8378 papers

Title	Date	Tasks	Status
Optimization Dynamics of Equivariant and Augmented Neural Networks	Mar 23, 2023	Data Augmentation	CodeCode Available
Optimization of Artificial Neural Networks models applied to the identification of images of asteroids' resonant arguments	Jul 28, 2022	Data Augmentation	CodeCode Available
Optimized Automated Cardiac MR Scar Quantification with GAN-Based Data Augmentation	Sep 27, 2021	Data Augmentation	CodeCode Available
A Two-Stage Method for Text Line Detection in Historical Documents	Feb 9, 2018	ClusteringData Augmentation	CodeCode Available
SemiCurv: Semi-Supervised Curvilinear Structure Segmentation	May 18, 2022	Data AugmentationSegmentation	CodeCode Available
G-PECNet: Towards a Generalizable Pedestrian Trajectory Prediction System	Oct 15, 2022	Autonomous VehiclesData Augmentation	CodeCode Available
ChessMix: Spatial Context Data Augmentation for Remote Sensing Semantic Segmentation	Aug 26, 2021	Data Augmentationimage-classification	CodeCode Available
Optimizing Heat Alert Issuance with Reinforcement Learning	Dec 21, 2023	Data AugmentationDecision Making	CodeCode Available
Empirical Study of Text Augmentation on Social Media Text in Vietnamese	Sep 25, 2020	Data AugmentationGeneral Classification	CodeCode Available
NeuroMixGDP: A Neural Collapse-Inspired Random Mixup for Private Data Release	Feb 14, 2022	Data AugmentationPrivacy Preserving	CodeCode Available
Towards Speaker Identification with Minimal Dataset and Constrained Resources using 1D-Convolution Neural Network	Nov 22, 2024	Data AugmentationSpeaker Identification	CodeCode Available
Optimizing Synthetic Data for Enhanced Pancreatic Tumor Segmentation	Jul 27, 2024	Data AugmentationDecision Making	CodeCode Available
Cheap and Good? Simple and Effective Data Augmentation for Low Resource Machine Reading	Jun 8, 2021	Data AugmentationMachine Reading Comprehension	CodeCode Available
Empirical Study of Mix-based Data Augmentation Methods in Physiological Time Series Data	Sep 18, 2023	Data AugmentationTime Series	CodeCode Available
Empirical Advocacy of Bio-inspired Models for Robust Image Recognition	May 18, 2022	Data Augmentation	CodeCode Available
A Dataset of Laryngeal Endoscopic Images with Comparative Study on Convolution Neural Network Based Semantic Segmentation	Jul 16, 2018	Data AugmentationMedical Image Analysis	CodeCode Available
Order-preserving Consistency Regularization for Domain Adaptation and Generalization	Sep 23, 2023	Data AugmentationDomain Adaptation	CodeCode Available
Analyzing Data Augmentation for Medical Images: A Case Study in Ultrasound Images	Mar 14, 2024	Data AugmentationMedical Image Analysis	CodeCode Available
Semi-supervised 3D Object Detection with PatchTeacher and PillarMix	Jul 13, 2024	3D Object DetectionData Augmentation	CodeCode Available
ChatGPT Based Data Augmentation for Improved Parameter-Efficient Debiasing of LLMs	Feb 19, 2024	Data AugmentationFairness	CodeCode Available
Taste More, Taste Better: Diverse Data and Strong Model Boost Semi-Supervised Crowd Counting	Mar 23, 2025	Crowd CountingData Augmentation	CodeCode Available
UniPSDA: Unsupervised Pseudo Semantic Data Augmentation for Zero-Shot Cross-Lingual Natural Language Understanding	Jun 24, 2024	Data AugmentationNatural Language Understanding	CodeCode Available
Embedding Hallucination for Few-Shot Language Fine-tuning	May 3, 2022	Data AugmentationHallucination	CodeCode Available
ChatGPT as Data Augmentation for Compositional Generalization: A Case Study in Open Intent Detection	Aug 25, 2023	Data AugmentationIntent Detection	CodeCode Available
AugGPT: Leveraging ChatGPT for Text Data Augmentation	Feb 25, 2023	Data AugmentationFew-Shot Learning	CodeCode Available
Analysis and Optimization of Convolutional Neural Network Architectures	Jul 31, 2017	Data AugmentationObject Recognition	CodeCode Available
Effortless Deep Training for Traffic Sign Detection Using Templates and Arbitrary Natural Images	Jul 23, 2019	Autonomous DrivingData Augmentation	CodeCode Available
Efficient Training Under Limited Resources	Jan 23, 2023	Data AugmentationNeural Architecture Search	CodeCode Available
Analysing the Robustness of Dual Encoders for Dense Retrieval Against Misspellings	May 4, 2022	Contrastive LearningData Augmentation	CodeCode Available
Towards Understanding Gender Bias in Relation Extraction	Nov 9, 2019	counterfactualData Augmentation	CodeCode Available
CHARD: Clinical Health-Aware Reasoning Across Dimensions for Text Generation Models	Oct 9, 2022	Clinical KnowledgeData Augmentation	CodeCode Available
Efficient Topology-aware Data Augmentation for High-Degree Graph Neural Networks	Jun 8, 2024	AttributeData Augmentation	CodeCode Available
Efficient Gaussian Process Classification Using Polya-Gamma Data Augmentation	Feb 18, 2018	ClassificationData Augmentation	CodeCode Available
T-CGAN: Conditional Generative Adversarial Network for Data Augmentation in Noisy Time Series with Irregular Sampling	Nov 20, 2018	Data AugmentationGenerative Adversarial Network	CodeCode Available
Towards Understanding How Data Augmentation Works with Imbalanced Data	Apr 12, 2023	Data Augmentationfeature selection	CodeCode Available
OverPrompt: Enhancing ChatGPT through Efficient In-Context Learning	May 24, 2023	Data AugmentationFact Checking	CodeCode Available
Efficient Diffusion-Driven Corruption Editor for Test-Time Adaptation	Mar 16, 2024	Data AugmentationTest-time Adaptation	CodeCode Available
VideoDG: Generalizing Temporal Relations in Videos to Novel Domains	Dec 8, 2019	Action RecognitionData Augmentation	CodeCode Available
Semi-Supervised Few-Shot Learning via Multi-Factor Clustering	Jan 1, 2022	ClusteringData Augmentation	CodeCode Available
TdAttenMix: Top-Down Attention Guided Mixup	Jan 26, 2025	Data Augmentation	CodeCode Available
A Data Cartography based MixUp for Pre-trained Language Models	May 6, 2022	Data AugmentationLanguage Modeling	CodeCode Available
PAGANDA: An Adaptive Task-Independent Automatic Data Augmentation	May 16, 2019	BIG-bench Machine LearningData Augmentation	CodeCode Available
Efficient Deep Learning Architectures for Fast Identification of Bacterial Strains in Resource-Constrained Devices	Jun 11, 2021	Data AugmentationTransfer Learning	CodeCode Available
Attack-Augmentation Mixing-Contrastive Skeletal Representation Learning	Apr 8, 2023	Action RecognitionContrastive Learning	CodeCode Available
A Transductive Multi-Head Model for Cross-Domain Few-Shot Learning	Jun 8, 2020	Cross-Domain Few-Shotcross-domain few-shot learning	CodeCode Available
Semi-Supervised Learning by Disentangling and Self-Ensembling Over Stochastic Latent Space	Jul 22, 2019	Data AugmentationMulti-Label Classification	CodeCode Available
A Tale Of Two Long Tails	Jul 27, 2021	Data AugmentationVocal Bursts Valence Prediction	CodeCode Available
AdaptSSR: Pre-training User Model with Augmentation-Adaptive Self-Supervised Ranking	Oct 15, 2023	Contrastive LearningData Augmentation	CodeCode Available
Character-Level Question Answering with Attention	Apr 4, 2016	Data AugmentationDecoder	CodeCode Available
Teaching Dense Retrieval Models to Specialize with Listwise Distillation and LLM Data Augmentation	Feb 27, 2025	Data AugmentationDomain Generalization	CodeCode Available

Show:10 25 50

← PrevPage 164 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified