Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1401–1450 of 8378 papers

Title	Date	Tasks	Status	Hype
MixEdit: Revisiting Data Augmentation and Beyond for Grammatical Error Correction	Oct 18, 2023	Data AugmentationDiversity	CodeCode Available	1
MixGen: A New Multi-Modal Data Augmentation	Jun 16, 2022	Data AugmentationImage-text Retrieval	CodeCode Available	1
Compositional Generalization for Multi-label Text Classification: A Data-Augmentation Approach	Dec 18, 2023	ClassificationData Augmentation	CodeCode Available	1
MixPro: Data Augmentation with MaskMix and Progressive Attention Labeling for Vision Transformer	Apr 24, 2023	Data AugmentationImage Augmentation	CodeCode Available	1
MixSKD: Self-Knowledge Distillation from Mixup for Image Recognition	Aug 11, 2022	Data Augmentationimage-classification	CodeCode Available	1
MixText: Linguistically-Informed Interpolation of Hidden Space for Semi-Supervised Text Classification	Apr 25, 2020	ClassificationData Augmentation	CodeCode Available	1
Cross-modulated Few-shot Image Generation for Colorectal Tissue Classification	Apr 4, 2023	Data Augmentationimage-classification	CodeCode Available	1
CST5: Data Augmentation for Code-Switched Semantic Parsing	Nov 14, 2022	Data AugmentationSemantic Parsing	CodeCode Available	1
AutoCLINT: The Winning Method in AutoCV Challenge 2019	May 9, 2020	BIG-bench Machine LearningData Augmentation	CodeCode Available	1
MODALS: Modality-agnostic Automated Data Augmentation in the Latent Space	Jan 1, 2021	Data AugmentationTime Series	CodeCode Available	1
AutoBalance: Optimized Loss Functions for Imbalanced Data	Jan 4, 2022	Data AugmentationFairness	CodeCode Available	1
Model Patching: Closing the Subgroup Performance Gap with Data Augmentation	Aug 15, 2020	Cancer ClassificationData Augmentation	CodeCode Available	1
Cross-modality Data Augmentation for End-to-End Sign Language Translation	May 18, 2023	Data AugmentationKnowledge Distillation	CodeCode Available	1
Monkeypox Image Data collection	Jun 3, 2022	Data Augmentation	CodeCode Available	1
CUDA: Curriculum of Data Augmentation for Long-Tailed Recognition	Feb 10, 2023	Data AugmentationLong-tail Learning	CodeCode Available	1
CONAN - COunter NArratives through Nichesourcing: a Multilingual Dataset of Responses to Fight Online Hate Speech	Jul 1, 2019	Data AugmentationTranslation	CodeCode Available	1
MosaicFusion: Diffusion Models as Data Augmenters for Large Vocabulary Instance Segmentation	Sep 22, 2023	Data AugmentationInstance Segmentation	CodeCode Available	1
CVAE-GAN: Fine-Grained Image Generation through Asymmetric Training	Mar 29, 2017	AttributeData Augmentation	CodeCode Available	1
MotionAug: Augmentation with Physical Correction for Human Motion Prediction	Mar 17, 2022	Data AugmentationDiversity	CodeCode Available	1
Motion-Focused Contrastive Learning of Video Representations	Jan 11, 2022	Contrastive LearningData Augmentation	CodeCode Available	1
A Probabilistic Framework for Knowledge Graph Data Augmentation	Oct 25, 2021	Data AugmentationKnowledge Graph Completion	CodeCode Available	1
Motion Robust High-Speed Light-Weighted Object Detection With Event Camera	Aug 24, 2022	Data Augmentationobject-detection	CodeCode Available	1
Capturing complex hand movements and object interactions using machine learning-powered stretchable smart textile gloves	Oct 3, 2024	Data Augmentation	CodeCode Available	1
AADG: Automatic Augmentation for Domain Generalization on Retinal Image Segmentation	Jul 27, 2022	Data AugmentationDeep Reinforcement Learning	CodeCode Available	1
Enhancing Recipe Retrieval with Foundation Models: A Data Augmentation Perspective	Dec 8, 2023	Cross-Modal RetrievalData Augmentation	CodeCode Available	1
Multi-Class Segmentation of Aortic Branches and Zones in Computed Tomography Angiography: The AortaSeg24 Challenge	Feb 7, 2025	Data AugmentationSegmentation	CodeCode Available	1
Multi-modal Conditional Bounding Box Regression for Music Score Following	May 10, 2021	Data Augmentationobject-detection	CodeCode Available	1
Multimodal Data Augmentation for Visual-Infrared Person ReID with Corrupted Data	Nov 22, 2022	Data Augmentation	CodeCode Available	1
Cross-Domain Feature Augmentation for Domain Generalization	May 14, 2024	Data AugmentationDiversity	CodeCode Available	1
Cross-Domain Adaptive Teacher for Object Detection	Nov 25, 2021	Data AugmentationDomain Adaptation	CodeCode Available	1
CAR-MFL: Cross-Modal Augmentation by Retrieval for Multimodal Federated Learning with Missing Modalities	Jul 11, 2024	Data AugmentationFederated Learning	CodeCode Available	1
CarveMix: A Simple Data Augmentation Method for Brain Lesion Segmentation	Aug 16, 2021	Data AugmentationLesion Segmentation	CodeCode Available	1
Enhancing Text-based Knowledge Graph Completion with Zero-Shot Large Language Models: A Focus on Semantic Enhancement	Oct 12, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
Multiview Detection with Shadow Transformer (and View-Coherent Data Augmentation)	Aug 12, 2021	Data AugmentationMultiview Detection	CodeCode Available	1
MUM: Mix Image Tiles and UnMix Feature Tiles for Semi-Supervised Object Detection	Jan 1, 2022	Data Augmentationobject-detection	CodeCode Available	1
Cascaded deep monocular 3D human pose estimation with evolutionary training data	Jun 14, 2020	3D Human Pose EstimationData Augmentation	CodeCode Available	1
MusicLDM: Enhancing Novelty in Text-to-Music Generation Using Beat-Synchronous Mixup Strategies	Aug 3, 2023	Audio GenerationBeat Tracking	CodeCode Available	1
Cross-domain Compositing with Pretrained Diffusion Models	Feb 20, 2023	Data AugmentationObject	CodeCode Available	1
AcroFOD: An Adaptive Method for Cross-domain Few-shot Object Detection	Sep 22, 2022	Cross-Domain Few-ShotCross-Domain Few-Shot Object Detection	CodeCode Available	1
Conditioned Text Generation with Transfer for Closed-Domain Dialogue Systems	Nov 3, 2020	Data AugmentationDiversity	CodeCode Available	1
Cross-head mutual Mean-Teaching for semi-supervised medical image segmentation	Oct 8, 2023	Data AugmentationImage Segmentation	CodeCode Available	1
Natural Adversarial Examples	Jul 16, 2019	Adversarial AttackData Augmentation	CodeCode Available	1
Adversarial Semantic Data Augmentation for Human Pose Estimation	Aug 3, 2020	Data AugmentationDiversity	CodeCode Available	1
Negative Data Augmentation	Feb 9, 2021	Action RecognitionAnomaly Detection	CodeCode Available	1
Counterfactual Data Augmentation using Locally Factored Dynamics	Jul 6, 2020	counterfactualData Augmentation	CodeCode Available	1
Counterfactual Data Augmentation for Neural Machine Translation	Jun 1, 2021	counterfactualData Augmentation	CodeCode Available	1
ACTION: Augmentation and Computation Toolbox for Brain Network Analysis with Functional MRI	May 10, 2024	Data AugmentationFederated Learning	CodeCode Available	1
Causal Action Influence Aware Counterfactual Data Augmentation	May 29, 2024	counterfactualCounterfactual Reasoning	CodeCode Available	1
Neural Topic Modeling with Continual Lifelong Learning	Jun 19, 2020	Data AugmentationInformation Retrieval	CodeCode Available	1
Learning from Counterfactual Links for Link Prediction	Jun 3, 2021	Causal Inferencecounterfactual	CodeCode Available	1

Show:10 25 50

← PrevPage 29 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified