Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7401–7450 of 8378 papers

Title	Date	Tasks	Status
Music Source Separation in the Waveform Domain	Nov 27, 2019	Audio GenerationAudio Synthesis	—Unverified
PanDA: Panoptic Data Augmentation	Nov 27, 2019	Data AugmentationInstance Segmentation	—Unverified
Enhancing Out-Of-Domain Utterance Detection with Data Augmentation Based on Word Embeddings	Nov 24, 2019	Data AugmentationWord Embeddings	—Unverified
DeepSmartFuzzer: Reward Guided Test Generation For Deep Learning	Nov 24, 2019	Data AugmentationDeep Learning	CodeCode Available
Unsupervised Neural Sensor Models for Synthetic LiDAR Data Augmentation	Nov 24, 2019	Data Augmentationobject-detection	—Unverified
Visualizing Point Cloud Classifiers by Curvature Smoothing	Nov 23, 2019	Data AugmentationGeneral Classification	CodeCode Available
Computational Ceramicology	Nov 22, 2019	Data Augmentation	—Unverified
GANkyoku: a Generative Adversarial Network for Shakuhachi Music	Nov 22, 2019	Data AugmentationGenerative Adversarial Network	CodeCode Available
Improving N-gram Language Models with Pre-trained Deep Transformer	Nov 22, 2019	Data Augmentationspeech-recognition	—Unverified
Improving Conditioning in Context-Aware Sequence to Sequence Models	Nov 21, 2019	abstractive question answeringData Augmentation	—Unverified
Generating Diverse Translation by Manipulating Multi-Head Attention	Nov 21, 2019	Data AugmentationDecoder	—Unverified
On Using SpecAugment for End-to-End Speech Translation	Nov 20, 2019	Data AugmentationTranslation	—Unverified
The Origins and Prevalence of Texture Bias in Convolutional Neural Networks	Nov 20, 2019	Data AugmentationObject Recognition	—Unverified
DermGAN: Synthetic Generation of Clinical Skin Images with Pathology	Nov 20, 2019	Data Augmentation	—Unverified
Action Recognition Using Volumetric Motion Representations	Nov 19, 2019	Action RecognitionData Augmentation	CodeCode Available
Constructing Multiple Tasks for Augmentation: Improving Neural Image Classification With K-means Features	Nov 18, 2019	ClusteringData Augmentation	CodeCode Available
Counterfactual Vision-and-Language Navigation via Adversarial Path Sampling	Nov 17, 2019	counterfactualCounterfactual Reasoning	—Unverified
Faster AutoAugment: Learning Augmentation Strategies using Backpropagation	Nov 16, 2019	Data Augmentation	CodeCode Available
Signed Input Regularization	Nov 16, 2019	Data Augmentation	—Unverified
Robustness to Capitalization Errors in Named Entity Recognition	Nov 13, 2019	Data Augmentationnamed-entity-recognition	—Unverified
A Smartphone-Based Skin Disease Classification Using MobileNet CNN	Nov 13, 2019	ClassificationData Augmentation	—Unverified
Learning from Data-Rich Problems: A Case Study on Genetic Variant Calling	Nov 12, 2019	Data Augmentation	—Unverified
Improving Robustness of Task Oriented Dialog Systems	Nov 12, 2019	Adversarial AttackData Augmentation	—Unverified
Logo-2K+: A Large-Scale Logo Dataset for Scalable Logo Classification	Nov 11, 2019	2kClassification	CodeCode Available
Queens are Powerful too: Mitigating Gender Bias in Dialogue Generation	Nov 10, 2019	counterfactualData Augmentation	—Unverified
XceptionTime: A Novel Deep Architecture based on Depthwise Separable Convolutions for Hand Gesture Classification	Nov 9, 2019	Data AugmentationGeneral Classification	CodeCode Available
Towards Understanding Gender Bias in Relation Extraction	Nov 9, 2019	counterfactualData Augmentation	CodeCode Available
Transforming Wikipedia into Augmented Data for Query-Focused Summarization	Nov 8, 2019	Data AugmentationQuery-focused Summarization	—Unverified
Not Enough Data? Deep Learning to the Rescue!	Nov 8, 2019	Data AugmentationDeep Learning	—Unverified
Microsoft Research Asia's Systems for WMT19	Nov 7, 2019	Data AugmentationKnowledge Distillation	—Unverified
SentiLARE: Sentiment-Aware Language Representation Learning with Linguistic Knowledge	Nov 6, 2019	Data AugmentationLanguage Modeling	CodeCode Available
SRINet: Learning Strictly Rotation-Invariant Representations for Point Cloud Classification and Segmentation	Nov 6, 2019	Data AugmentationGeneral Classification	—Unverified
An "augmentation-free" rotation invariant classification scheme on point-cloud and its application to neuroimaging	Nov 5, 2019	Data AugmentationGeneral Classification	—Unverified
Scalable Deep Generative Relational Models with High-Order Node Dependence	Nov 4, 2019	Data AugmentationLink Prediction	—Unverified
Learning from Explanations with Neural Execution Tree	Nov 4, 2019	Data AugmentationMulti-hop Question Answering	CodeCode Available
Enhanced Convolutional Neural Tangent Kernels	Nov 3, 2019	Data Augmentationregression	—Unverified
Training Data Augmentation for Detecting Adverse Drug Reactions in User-Generated Content	Nov 1, 2019	Data Augmentation	—Unverified
Data augmentation using back-translation for context-aware neural machine translation	Nov 1, 2019	Data AugmentationMachine Translation	—Unverified
KNU-HYUNDAI's NMT system for Scientific Paper and Patent Tasks onWAT 2019	Nov 1, 2019	Data AugmentationMachine Translation	—Unverified
End-to-end Speech Translation System Description of LIT for IWSLT 2019	Nov 1, 2019	Data AugmentationDecoder	—Unverified
Understanding Data Augmentation in Neural Machine Translation: Two Perspectives towards Generalization	Nov 1, 2019	Data AugmentationMachine Translation	—Unverified
Improving Language Generation from Feature-Rich Tree-Structured Data with Relational Graph Convolutional Encoders	Nov 1, 2019	Data AugmentationText Generation	—Unverified
SYSTRAN @ WAT 2019: Russian-Japanese News Commentary task	Nov 1, 2019	Data AugmentationSynthetic Data Generation	—Unverified
Improving Neural Machine Translation Robustness via Data Augmentation: Beyond Back-Translation	Nov 1, 2019	Data AugmentationDiversity	CodeCode Available
Benefits of Data Augmentation for NMT-based Text Normalization of User-Generated Content	Nov 1, 2019	Data AugmentationDecoder	—Unverified
Supervised neural machine translation based on data augmentation and improved training \& inference process	Nov 1, 2019	Data AugmentationMachine Translation	—Unverified
Character-Based Models for Adversarial Phone Extraction: Preventing Human Sex Trafficking	Nov 1, 2019	Data AugmentationLanguage Modeling	—Unverified
Abstract Text Summarization: A Low Resource Challenge	Nov 1, 2019	Data AugmentationText Summarization	—Unverified
Enhanced Transformer Model for Data-to-Text Generation	Nov 1, 2019	Data AugmentationData-to-Text Generation	—Unverified
Cost-Sensitive BERT for Generalisable Sentence Classification on Imbalanced Data	Nov 1, 2019	ClassificationData Augmentation	—Unverified

Show:10 25 50

← PrevPage 149 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified