Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6951–7000 of 8378 papers

Title	Date	Tasks	Status	Hype
The Penalty Imposed by Ablated Data Augmentation	Jun 8, 2020	Data Augmentation	—Unverified	0
Learning Diagnosis of COVID-19 from a Single Radiological Image	Jun 6, 2020	COVID-19 DiagnosisData Augmentation	CodeCode Available	0
Enhancing Facial Data Diversity with Style-based Face Aging	Jun 6, 2020	Data AugmentationDiversity	—Unverified	0
An Empirical Analysis of the Impact of Data Augmentation on Knowledge Distillation	Jun 6, 2020	Data AugmentationKnowledge Distillation	—Unverified	0
Data Augmentation using Generative Adversarial Networks (GANs) for GAN-based Detection of Pneumonia and COVID-19 in Chest X-ray Images	Jun 5, 2020	Anomaly DetectionData Augmentation	—Unverified	0
Learning Neural Light Transport	Jun 5, 2020	Data AugmentationDenoising	—Unverified	0
Data Augmentation for Enhancing EEG-based Emotion Recognition with Deep Generative Models	Jun 4, 2020	Data AugmentationEEG	—Unverified	0
Handling missing data in model-based clustering	Jun 4, 2020	ClusteringData Augmentation	—Unverified	0
End-to-End Speech-Translation with Knowledge Distillation: FBK@IWSLT2020	Jun 4, 2020	Data AugmentationKnowledge Distillation	—Unverified	0
Self-supervised Training of Graph Convolutional Networks	Jun 3, 2020	Data AugmentationSelf-Supervised Learning	CodeCode Available	1
SaliencyMix: A Saliency Guided Data Augmentation Strategy for Better Regularization	Jun 2, 2020	Data Augmentationobject-detection	CodeCode Available	1
SmoothMix: A Simple Yet Effective Data Augmentation to Train Robust Classifiers	Jun 1, 2020	Data Augmentationimage-classification	—Unverified	0
Augmenting DL with Adversarial Training for Robust Prediction of Epilepsy Seizures	Jun 1, 2020	BIG-bench Machine LearningData Augmentation	CodeCode Available	1
A U-Net Based Discriminator for Generative Adversarial Networks	Jun 1, 2020	Data Augmentation	—Unverified	0
Probabilistic Structural Latent Representation for Unsupervised Embedding	Jun 1, 2020	Data AugmentationImage Classification	CodeCode Available	0
Composing Good Shots by Exploiting Mutual Relations	Jun 1, 2020	Data Augmentation	CodeCode Available	1
Learning Augmentation Network via Influence Functions	Jun 1, 2020	ClassificationData Augmentation	—Unverified	0
Bayesian Adversarial Human Motion Synthesis	Jun 1, 2020	Bayesian InferenceData Augmentation	CodeCode Available	1
A Comprehensive Study of Data Augmentation Strategies for Prostate Cancer Detection in Diffusion-weighted MRI using Convolutional Neural Networks	Jun 1, 2020	Data Augmentation	—Unverified	0
Symbol Spotting on Digital Architectural Floor Plans Using a Deep Learning-based Framework	Jun 1, 2020	Data Augmentationobject-detection	—Unverified	0
Automatic classification between COVID-19 pneumonia, non-COVID-19 pneumonia, and the healthy on chest X-ray image: combination of data augmentation methods	Jun 1, 2020	Data AugmentationTransfer Learning	CodeCode Available	0
Pseudo-Representation Labeling Semi-Supervised Learning	May 31, 2020	Data AugmentationRepresentation Learning	—Unverified	0
Data Augmentation with Unsupervised Machine Translation Improves the Structural Similarity of Cross-lingual Word Embeddings	May 30, 2020	Cross-Lingual Word EmbeddingsData Augmentation	—Unverified	0
A Comparative Study of Lexical Substitution Approaches based on Neural Language Models	May 29, 2020	Data AugmentationRelation Extraction	—Unverified	0
Synthesizing lesions using contextual GANs improves breast cancer classification on mammograms	May 29, 2020	Cancer ClassificationData Augmentation	—Unverified	0
ACGAN-based Data Augmentation Integrated with Long-term Scalogram for Acoustic Scene Classification	May 27, 2020	Acoustic Scene ClassificationData Augmentation	—Unverified	0
Generative Adversarial Networks for Bitcoin Data Augmentation	May 27, 2020	BIG-bench Machine LearningClassification	—Unverified	0
Learning Robust Feature Representations for Scene Text Detection	May 26, 2020	Data AugmentationScene Text Detection	—Unverified	0
Towards a Robust WiFi-based Fall Detection with Adversarial Data Augmentation	May 25, 2020	BIG-bench Machine LearningData Augmentation	—Unverified	0
A Joint Pixel and Feature Alignment Framework for Cross-dataset Palmprint Recognition	May 25, 2020	Data AugmentationDomain Adaptation	CodeCode Available	1
ON-TRAC Consortium for End-to-End and Simultaneous Speech Translation Challenge Tasks at IWSLT 2020	May 24, 2020	Data AugmentationDecoder	—Unverified	0
Networks with pixels embedding: a method to improve noise resistance in images classification	May 24, 2020	ClassificationData Augmentation	CodeCode Available	0
DeltaPy: A Framework for Tabular Data Augmentation in Python	May 22, 2020	BIG-bench Machine LearningData Augmentation	CodeCode Available	1
Microphone Array Based Surveillance Audio Classification	May 22, 2020	Audio ClassificationClassification	—Unverified	0
Graph Random Neural Network for Semi-Supervised Learning on Graphs	May 22, 2020	Data AugmentationGraph Learning	CodeCode Available	1
Multistream CNN for Robust Acoustic Modeling	May 21, 2020	Data Augmentationspeech-recognition	—Unverified	0
Fluent Response Generation for Conversational Question Answering	May 21, 2020	Conversational Question AnsweringData Augmentation	CodeCode Available	1
Training Keyword Spotting Models on Non-IID Data with Federated Learning	May 21, 2020	Data AugmentationFederated Learning	—Unverified	0
ASAPP-ASR: Multistream CNN and Self-Attentive SRU for SOTA Speech Recognition	May 21, 2020	Data AugmentationDiversity	—Unverified	0
Cross-Domain Few-Shot Learning with Meta Fine-Tuning	May 21, 2020	Cross-Domain Few-Shotcross-domain few-shot learning	—Unverified	0
What Makes for Good Views for Contrastive Learning?	May 20, 2020	Contrastive LearningData Augmentation	—Unverified	0
Lung Segmentation from Chest X-rays using Variational Data Imputation	May 20, 2020	Data AugmentationImage Segmentation	CodeCode Available	1
AutoML Segmentation for 3D Medical Image Data: Contribution to the MSD Challenge 2018	May 20, 2020	3D Semantic SegmentationAutoML	CodeCode Available	1
Improving Deep Learning Models via Constraint-Based Domain Knowledge: a Brief Survey	May 19, 2020	Data Augmentation	—Unverified	0
Triple-GAIL: A Multi-Modal Imitation Learning Framework with Generative Adversarial Nets	May 19, 2020	Autonomous VehiclesData Augmentation	—Unverified	0
Iterative Pseudo-Labeling for Speech Recognition	May 19, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
The NTNU System at the Interspeech 2020 Non-Native Children's Speech ASR Challenge	May 18, 2020	Data AugmentationDiversity	—Unverified	0
Feature Transformation Ensemble Model with Batch Spectral Regularization for Cross-Domain Few-Shot Classification	May 18, 2020	Cross-Domain Few-Shotcross-domain few-shot learning	—Unverified	0
On the effectiveness of GAN generated cardiac MRIs for segmentation	May 18, 2020	Cardiac SegmentationData Augmentation	—Unverified	0
Throwing Darts in the Dark? Detecting Bots with Limited Data using Neural Data Augmentation	May 17, 2020	BIG-bench Machine LearningData Augmentation	—Unverified	0

Show:10 25 50

← PrevPage 140 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified