Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7151–7200 of 8378 papers

Title	Date	Tasks	Status
Synthesizing lesions using contextual GANs improves breast cancer classification on mammograms	May 29, 2020	Cancer ClassificationData Augmentation	—Unverified
ACGAN-based Data Augmentation Integrated with Long-term Scalogram for Acoustic Scene Classification	May 27, 2020	Acoustic Scene ClassificationData Augmentation	—Unverified
Generative Adversarial Networks for Bitcoin Data Augmentation	May 27, 2020	BIG-bench Machine LearningClassification	—Unverified
Learning Robust Feature Representations for Scene Text Detection	May 26, 2020	Data AugmentationScene Text Detection	—Unverified
Towards a Robust WiFi-based Fall Detection with Adversarial Data Augmentation	May 25, 2020	BIG-bench Machine LearningData Augmentation	—Unverified
Networks with pixels embedding: a method to improve noise resistance in images classification	May 24, 2020	ClassificationData Augmentation	CodeCode Available
ON-TRAC Consortium for End-to-End and Simultaneous Speech Translation Challenge Tasks at IWSLT 2020	May 24, 2020	Data AugmentationDecoder	—Unverified
Microphone Array Based Surveillance Audio Classification	May 22, 2020	Audio ClassificationClassification	—Unverified
Training Keyword Spotting Models on Non-IID Data with Federated Learning	May 21, 2020	Data AugmentationFederated Learning	—Unverified
ASAPP-ASR: Multistream CNN and Self-Attentive SRU for SOTA Speech Recognition	May 21, 2020	Data AugmentationDiversity	—Unverified
Multistream CNN for Robust Acoustic Modeling	May 21, 2020	Data Augmentationspeech-recognition	—Unverified
Cross-Domain Few-Shot Learning with Meta Fine-Tuning	May 21, 2020	Cross-Domain Few-Shotcross-domain few-shot learning	—Unverified
What Makes for Good Views for Contrastive Learning?	May 20, 2020	Contrastive LearningData Augmentation	—Unverified
Triple-GAIL: A Multi-Modal Imitation Learning Framework with Generative Adversarial Nets	May 19, 2020	Autonomous VehiclesData Augmentation	—Unverified
Improving Deep Learning Models via Constraint-Based Domain Knowledge: a Brief Survey	May 19, 2020	Data Augmentation	—Unverified
Iterative Pseudo-Labeling for Speech Recognition	May 19, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
On the effectiveness of GAN generated cardiac MRIs for segmentation	May 18, 2020	Cardiac SegmentationData Augmentation	—Unverified
Feature Transformation Ensemble Model with Batch Spectral Regularization for Cross-Domain Few-Shot Classification	May 18, 2020	Cross-Domain Few-Shotcross-domain few-shot learning	—Unverified
The NTNU System at the Interspeech 2020 Non-Native Children's Speech ASR Challenge	May 18, 2020	Data AugmentationDiversity	—Unverified
Throwing Darts in the Dark? Detecting Bots with Limited Data using Neural Data Augmentation	May 17, 2020	BIG-bench Machine LearningData Augmentation	—Unverified
FuCiTNet: Improving the generalization of deep learning networks by the fusion of learned class-inherent transformations	May 17, 2020	Data AugmentationGeneral Classification	CodeCode Available
Leveraging Affective Bidirectional Transformers for Offensive Language Detection	May 16, 2020	Data AugmentationFeature Engineering	—Unverified
Target Speech Extraction Based on Blind Source Separation and X-vector-based Speaker Selection Trained with Data Augmentation	May 16, 2020	blind source separationData Augmentation	CodeCode Available
"I have vxxx bxx connexxxn!": Facing Packet Loss in Deep Speech Emotion Recognition	May 15, 2020	Data AugmentationEmotion Recognition	—Unverified
KEIS@JUST at SemEval-2020 Task 12: Identifying Multilingual Offensive Tweets Using Weighted Ensemble and Fine-Tuned BERT	May 15, 2020	Data AugmentationTransfer Learning	—Unverified
VirAAL: Virtual Adversarial Active Learning For NLU	May 14, 2020	Active LearningData Augmentation	CodeCode Available
You Do Not Need More Data: Improving End-To-End Speech Recognition by Text-To-Speech Data Augmentation	May 14, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Proxy Experience Replay: Federated Distillation for Distributed Reinforcement Learning	May 13, 2020	ClusteringData Augmentation	—Unverified
ODVICE: An Ontology-Driven Visual Analytic Tool for Interactive Cohort Extraction	May 13, 2020	Data Augmentation	—Unverified
Towards Robustifying NLI Models Against Lexical Dataset Biases	May 10, 2020	Data AugmentationNatural Language Inference	CodeCode Available
Deep Learning on Point Clouds for False Positive Reduction at Nodule Detection in Chest CT Scans	May 7, 2020	Data AugmentationMedical Image Analysis	—Unverified
Data Augmentation via Mixed Class Interpolation using Cycle-Consistent Generative Adversarial Networks Applied to Cross-Domain Imagery	May 5, 2020	ClassificationData Augmentation	—Unverified
Data Augmentation for Hypernymy Detection	May 4, 2020	Data Augmentation	CodeCode Available
Correcting the Autocorrect: Context-Aware Typographical Error Correction via Training Data Augmentation	May 3, 2020	BIG-bench Machine LearningData Augmentation	—Unverified
Self-Training with Improved Regularization for Sample-Efficient Chest X-Ray Classification	May 3, 2020	Data AugmentationDiagnostic	—Unverified
A Causal View on Robustness of Neural Networks	May 3, 2020	Data Augmentation	—Unverified
A Comprehensive Survey of Grammar Error Correction	May 2, 2020	Data AugmentationLanguage Modelling	—Unverified
Improving Non-autoregressive Neural Machine Translation with Monolingual Data	May 2, 2020	Data AugmentationKnowledge Distillation	—Unverified
Neural Symbolic Reader: Scalable Integration of Distributed and Symbolic Representations for Reading Comprehension	May 1, 2020	Data AugmentationMath	—Unverified
Augmenting Small Data to Classify Contextualized Dialogue Acts for Exploratory Visualization	May 1, 2020	Data AugmentationData Visualization	—Unverified
When is Multi-task Learning Beneficial for Low-Resource Noisy Code-switched User-generated Algerian Texts?	May 1, 2020	Data AugmentationMulti-Task Learning	—Unverified
Stigma Annotation Scheme and Stigmatized Language Detection in Health-Care Discussions on Social Media	May 1, 2020	Data Augmentation	—Unverified
On the Benefits of Invariance in Neural Networks	May 1, 2020	Data Augmentation	—Unverified
Multilingual Neural Machine Translation involving Indian Languages	May 1, 2020	Data AugmentationMachine Translation	—Unverified
Data Augmentation using Machine Translation for Fake News Detection in the Urdu Language	May 1, 2020	ArticlesData Augmentation	—Unverified
Getting More Data for Low-resource Morphological Inflection: Language Models and Data Augmentation	May 1, 2020	Data AugmentationDecoder	—Unverified
Multiword Expression aware Neural Machine Translation	May 1, 2020	Data AugmentationMachine Translation	—Unverified
Conditional Augmentation for Aspect Term Extraction via Masked Sequence-to-Sequence Generation	Apr 30, 2020	Data AugmentationExtract Aspect	—Unverified
Does Data Augmentation Improve Generalization in NLP?	Apr 30, 2020	Data AugmentationFairness	—Unverified
Representations of Syntax [MASK] Useful: Effects of Constituency and Dependency Structure in Recursive LSTMs	Apr 30, 2020	Data Augmentation	CodeCode Available

Show:10 25 50

← PrevPage 144 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified