Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 801–850 of 8378 papers

Title	Date	Tasks	Status	Hype	Score
Coreference Resolution as Query-based Span Prediction	Nov 5, 2019	coreference-resolutionCoreference Resolution	CodeCode Available	1	5
ASR data augmentation in low-resource settings using cross-lingual multi-speaker TTS and cross-lingual voice conversion	Mar 29, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1	5
An augmentation strategy to mimic multi-scanner variability in MRI	Mar 23, 2021	Data Augmentation	CodeCode Available	1	5
CounterCurate: Enhancing Physical and Semantic Visio-Linguistic Compositional Reasoning via Counterfactual Examples	Feb 20, 2024	counterfactualData Augmentation	CodeCode Available	1	5
Image Augmentation Is All You Need: Regularizing Deep Reinforcement Learning from Pixels	Apr 28, 2020	AllAtari Games 100k	CodeCode Available	1	5
Cost-Sensitive BERT for Generalisable Sentence Classification with Imbalanced Data	Mar 16, 2020	ClassificationData Augmentation	CodeCode Available	1	5
Adapting pretrained speech model for Mandarin lyrics transcription and alignment	Nov 21, 2023	Automatic Lyrics TranscriptionData Augmentation	CodeCode Available	1	5
Counterfactual Cycle-Consistent Learning for Instruction Following and Generation in Vision-Language Navigation	Mar 30, 2022	counterfactualData Augmentation	CodeCode Available	1	5
Counterfactual Data Augmentation using Locally Factored Dynamics	Jul 6, 2020	counterfactualData Augmentation	CodeCode Available	1	5
Aspect-Controlled Neural Argument Generation	Apr 30, 2020	Data AugmentationLanguage Modeling	CodeCode Available	1	5
A Full Text-Dependent End to End Mispronunciation Detection and Diagnosis with Easy Data Augmentation Techniques	Apr 17, 2021	Data Augmentation	CodeCode Available	1	5
I'm Me, We're Us, and I'm Us: Tri-directional Contrastive Learning on Hypergraphs	Jun 9, 2022	Contrastive LearningData Augmentation	CodeCode Available	1	5
BSUV-Net: A Fully-Convolutional Neural Network for Background Subtraction of Unseen Videos	Jul 26, 2019	Data AugmentationObject Tracking	CodeCode Available	1	5
Learning from Counterfactual Links for Link Prediction	Jun 3, 2021	Causal Inferencecounterfactual	CodeCode Available	1	5
3D MRI Synthesis with Slice-Based Latent Diffusion Models: Improving Tumor Segmentation Tasks in Data-Scarce Regimes	Jun 8, 2024	Data AugmentationImage Generation	CodeCode Available	1	5
Improved Contrastive Divergence Training of Energy Based Models	Dec 2, 2020	Data AugmentationImage Generation	CodeCode Available	1	5
AutoBalance: Optimized Loss Functions for Imbalanced Data	Jan 4, 2022	Data AugmentationFairness	CodeCode Available	1	5
Improved Probabilistic Image-Text Representations	May 29, 2023	Data AugmentationImage-text matching	CodeCode Available	1	5
Improving BERT Model Using Contrastive Learning for Biomedical Relation Extraction	Apr 28, 2021	Contrastive LearningData Augmentation	CodeCode Available	1	5
Enhancing Text-based Knowledge Graph Completion with Zero-Shot Large Language Models: A Focus on Semantic Enhancement	Oct 12, 2023	Contrastive LearningData Augmentation	CodeCode Available	1	5
Improving Compositional Generalization with Latent Structure and Data Augmentation	Dec 14, 2021	Data AugmentationDiagnostic	CodeCode Available	1	5
Improving Contrastive Learning by Visualizing Feature Transformation	Aug 6, 2021	Contrastive LearningData Augmentation	CodeCode Available	1	5
Cross-domain Compositing with Pretrained Diffusion Models	Feb 20, 2023	Data AugmentationObject	CodeCode Available	1	5
Cross-Domain Adaptive Teacher for Object Detection	Nov 25, 2021	Data AugmentationDomain Adaptation	CodeCode Available	1	5
Diffusion-based Image Generation for In-distribution Data Augmentation in Surface Defect Detection	Jun 1, 2024	Data AugmentationDefect Detection	CodeCode Available	1	5
Cross-Domain Feature Augmentation for Domain Generalization	May 14, 2024	Data AugmentationDiversity	CodeCode Available	1	5
Inversion Circle Interpolation: Diffusion-based Image Augmentation for Data-scarce Classification	Aug 29, 2024	ClassificationData Augmentation	CodeCode Available	1	5
Cross-head mutual Mean-Teaching for semi-supervised medical image segmentation	Oct 8, 2023	Data AugmentationImage Segmentation	CodeCode Available	1	5
Cross-Lingual Cross-Age Group Adaptation for Low-Resource Elderly Speech Emotion Recognition	Jun 26, 2023	Data AugmentationEmotion Recognition	CodeCode Available	1	5
Improving fairness for spoken language understanding in atypical speech with Text-to-Speech	Nov 16, 2023	Data AugmentationFairness	CodeCode Available	1	5
scSSL-Bench: Benchmarking Self-Supervised Learning for Single-Cell Data	Jun 10, 2025	BenchmarkingData Augmentation	CodeCode Available	1	5
Astroformer: More Data Might not be all you need for Classification	Apr 3, 2023	AllAstronomy	CodeCode Available	1	5
Cross-View Meets Diffusion: Aerial Image Synthesis with Geometry and Text Guidance	Aug 8, 2024	BEV SegmentationData Augmentation	CodeCode Available	1	5
DAGAD: Data Augmentation for Graph Anomaly Detection	Oct 18, 2022	Anomaly DetectionData Augmentation	CodeCode Available	1	5
CultureLLM: Incorporating Cultural Differences into Large Language Models	Feb 9, 2024	Data AugmentationPrompt Engineering	CodeCode Available	1	5
A Study of Multilingual End-to-End Speech Recognition for Kazakh, Russian, and English	Aug 3, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1	5
CUDA: Curriculum of Data Augmentation for Long-Tailed Recognition	Feb 10, 2023	Data AugmentationLong-tail Learning	CodeCode Available	1	5
CST5: Data Augmentation for Code-Switched Semantic Parsing	Nov 14, 2022	Data AugmentationSemantic Parsing	CodeCode Available	1	5
CutDepth:Edge-aware Data Augmentation in Depth Estimation	Jul 16, 2021	Data AugmentationDepth Estimation	CodeCode Available	1	5
CVAE-GAN: Fine-Grained Image Generation through Asymmetric Training	Mar 29, 2017	AttributeData Augmentation	CodeCode Available	1	5
CutPaste: Self-Supervised Learning for Anomaly Detection and Localization	Apr 8, 2021	Anomaly ClassificationAnomaly Detection	CodeCode Available	1	5
CutMIB: Boosting Light Field Super-Resolution via Multi-View Image Blending	Jan 1, 2023	Data AugmentationDenoising	CodeCode Available	1	5
CyCNN: A Rotation Invariant CNN using Polar Mapping and Cylindrical Convolution Layers	Jul 21, 2020	ClassificationData Augmentation	CodeCode Available	1	5
A Study on Transferability of Deep Learning Models for Network Intrusion Detection	Dec 17, 2023	Data AugmentationIntrusion Detection	CodeCode Available	1	5
D3A-TS: Denoising-Driven Data Augmentation in Time Series	Dec 9, 2023	Data AugmentationDenoising	CodeCode Available	1	5
DAC-MR: Data Augmentation Consistency Based Meta-Regularization for Meta-Learning	May 13, 2023	Data AugmentationMeta-Learning	CodeCode Available	1	5
DIG-MILP: a Deep Instance Generator for Mixed-Integer Linear Programming with Feasibility Guarantee	Oct 20, 2023	Data Augmentation	CodeCode Available	1	5
DALDA: Data Augmentation Leveraging Diffusion Model and LLM with Adaptive Guidance Scaling	Sep 25, 2024	Data AugmentationDiversity	CodeCode Available	1	5
Source Code Data Augmentation for Deep Learning: A Survey	May 31, 2023	Data AugmentationDeep Learning	CodeCode Available	1	5
Disentangled Representations for Domain-generalized Cardiac Segmentation	Aug 26, 2020	AnatomyCardiac Segmentation	CodeCode Available	1	5

Show:10 25 50

← PrevPage 17 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified