Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2701–2750 of 8378 papers

Title	Date	Tasks	Status	Score
NegatER: Unsupervised Discovery of Negatives in Commonsense Knowledge Bases	Nov 15, 2020	Data AugmentationLanguage Modeling	CodeCode Available	5
Generating Images of the M87* Black Hole Using GANs	Dec 2, 2023	Data AugmentationImage Generation	CodeCode Available	5
An Effective Deployment of Diffusion LM for Data Augmentation in Low-Resource Sentiment Classification	Sep 5, 2024	Data AugmentationDiversity	CodeCode Available	5
DPN-SENet:A self-attention mechanism neural network for detection and diagnosis of COVID-19 from chest x-ray images	May 20, 2021	Data AugmentationDiagnostic	CodeCode Available	5
Generating Synthetic Data for Text Recognition	Aug 15, 2016	Data AugmentationImage Generation	CodeCode Available	5
MaSkel: A Model for Human Whole-body X-rays Generation from Human Masking Images	Apr 13, 2024	Data Augmentation	CodeCode Available	5
Balanced Split: A new train-test data splitting strategy for imbalanced datasets	Dec 17, 2022	Data AugmentationEnsemble Learning	CodeCode Available	5
Decision Mamba: A Multi-Grained State Space Model with Self-Evolution Regularization for Offline RL	Jun 8, 2024	Data AugmentationMamba	CodeCode Available	5
Generated Graph Detection	Jun 13, 2023	Data AugmentationFace Swapping	CodeCode Available	5
Generate then Refine: Data Augmentation for Zero-shot Intent Detection	Oct 2, 2024	Data AugmentationDiversity	CodeCode Available	5
Generating Synthetic Speech from SpokenVocab for Speech Translation	Oct 15, 2022	Data AugmentationMachine Translation	CodeCode Available	5
Generalizing Few-Shot Named Entity Recognizers to Unseen Domains with Type-Related Features	Oct 15, 2023	Data Augmentationfew-shot-ner	CodeCode Available	5
Generalizing Conversational Dense Retrieval via LLM-Cognition Data Augmentation	Feb 11, 2024	Contrastive LearningConversational Search	CodeCode Available	5
Generalizing to Unseen Domains via Adversarial Data Augmentation	May 30, 2018	Data AugmentationSemantic Segmentation	CodeCode Available	5
Generalize Polyp Segmentation via Inpainting across Diverse Backgrounds and Pseudo-Mask Refinement	May 21, 2024	Data Augmentation	CodeCode Available	5
Mitigating Data Redundancy to Revitalize Transformer-based Long-Term Time Series Forecasting System	Jul 16, 2022	Data AugmentationDecoder	CodeCode Available	5
MediAug: Exploring Visual Augmentation in Medical Imaging	Apr 26, 2025	Brain Tumor ClassificationData Augmentation	CodeCode Available	5
Medical Image Segmentation Using Deep Learning: A Survey	Sep 28, 2020	Data AugmentationDeep Learning	CodeCode Available	5
Generalizing Across Domains via Cross-Gradient Training	Apr 28, 2018	Data AugmentationDomain Adaptation	CodeCode Available	5
General-to-Detailed GAN for Infrequent Class Medical Images	Nov 28, 2018	Data Augmentation	CodeCode Available	5
Generation of Artificial CT Images using Patch-based Conditional Generative Adversarial Networks	May 19, 2022	Computed Tomography (CT)Data Augmentation	CodeCode Available	5
DDFAV: Remote Sensing Large Vision Language Models Dataset and Evaluation Benchmark	Nov 5, 2024	Data AugmentationHallucination	CodeCode Available	5
DDA: Dimensionality Driven Augmentation Search for Contrastive Learning in Laparoscopic Surgery	Jun 3, 2024	Contrastive LearningData Augmentation	CodeCode Available	5
ANDA: A Novel Data Augmentation Technique Applied to Salient Object Detection	Oct 3, 2019	Data AugmentationImage Augmentation	CodeCode Available	5
Bag of Tricks for In-Distribution Calibration of Pretrained Transformers	Feb 13, 2023	ClassificationData Augmentation	CodeCode Available	5
Meta-learning and Data Augmentation for Stress Testing Forecasting Models	Jun 24, 2024	Data AugmentationMeta-Learning	CodeCode Available	5
GAT: Guided Adversarial Training with Pareto-optimal Auxiliary Tasks	Feb 6, 2023	Adversarial RobustnessData Augmentation	CodeCode Available	5
Gaussian Blur and Relative Edge Response	Jan 2, 2023	Data Augmentation	CodeCode Available	5
GANsemble for Small and Imbalanced Data Sets: A Baseline for Synthetic Microplastics Data	Apr 10, 2024	Data Augmentation	CodeCode Available	5
Bad Global Minima Exist and SGD Can Reach Them	Jun 6, 2019	Data Augmentationimage-classification	CodeCode Available	5
GANkyoku: a Generative Adversarial Network for Shakuhachi Music	Nov 22, 2019	Data AugmentationGenerative Adversarial Network	CodeCode Available	5
DS@GT at CheckThat! 2025: Detecting Subjectivity via Transfer-Learning and Corrective Data Augmentation	Jul 8, 2025	ARCData Augmentation	CodeCode Available	5
A CNN-based tool for automatic tongue contour tracking in ultrasound images	Jul 24, 2019	Data Augmentation	CodeCode Available	5
Anchor Data Augmentation	Nov 12, 2023	Data Augmentationregression	CodeCode Available	5
GAN-GA: A Generative Model based on Genetic Algorithm for Medical Image Generation	Dec 30, 2023	Data AugmentationDiversity	CodeCode Available	5
DTW-Merge: A Novel Data Augmentation Technique for Time Series Classification	Mar 1, 2021	Data AugmentationDynamic Time Warping	CodeCode Available	5
Practical X-ray Gastric Cancer Diagnostic Support Using Refined Stochastic Data Augmentation and Hard Boundary Box Training	Aug 18, 2021	Data AugmentationDiagnostic	CodeCode Available	5
A Parameterized Generative Adversarial Network Using Cyclic Projection for Explainable Medical Image Classification	Nov 24, 2023	Data AugmentationGenerative Adversarial Network	CodeCode Available	5
Gender-Inclusive Grammatical Error Correction through Augmentation	Jun 12, 2023	Data AugmentationGrammatical Error Correction	CodeCode Available	5
Dataset Condensation with Differentiable Siamese Augmentation	Feb 16, 2021	Continual LearningData Augmentation	CodeCode Available	5
Back to the Roots: Reconstructing Large and Complex Cranial Defects using an Image-based Statistical Shape Model	Apr 12, 2022	Data Augmentation	CodeCode Available	5
G2GT: Retrosynthesis Prediction with Graph to Graph Attention Neural Network and Self-Training	Apr 19, 2022	Data AugmentationDecoder	CodeCode Available	5
Back-to-Bones: Rediscovering the Role of Backbones in Domain Generalization	Sep 2, 2022	Data Augmentationdomain classification	CodeCode Available	5
GaitASMS: Gait Recognition by Adaptive Structured Spatial Representation and Multi-Scale Temporal Aggregation	Jul 29, 2023	Data AugmentationGait Recognition	CodeCode Available	5
Fusion for Visual-Infrared Person ReID in Real-World Surveillance Using Corrupted Multimodal Data	Apr 29, 2023	Data AugmentationPerson Re-Identification	CodeCode Available	5
Dual encoding feature filtering generalized attention UNET for retinal vessel segmentation	Jun 2, 2025	Data AugmentationRetinal Vessel Segmentation	CodeCode Available	5
Fuzzy Cluster-Aware Contrastive Clustering for Time Series	Mar 28, 2025	ClusteringContrastive Learning	CodeCode Available	5
DualMatch: Robust Semi-Supervised Learning with Dual-Level Interaction	Oct 25, 2023	Data Augmentation	CodeCode Available	5
Galaxy Spin Classification I: Z-wise vs S-wise Spirals With Chirality Equivariant Residual Network	Oct 9, 2022	Data Augmentation	CodeCode Available	5
Fully Automatic and Real-Time Catheter Segmentation in X-Ray Fluoroscopy	Jul 17, 2017	Data Augmentation	CodeCode Available	5

Show:10 25 50

← PrevPage 55 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified