Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7001–7050 of 8378 papers

Title	Date	Tasks	Status	Hype
Global inducing point variational posteriors for Bayesian neural networks and deep Gaussian processes	May 17, 2020	Data AugmentationGaussian Processes	CodeCode Available	1
FuCiTNet: Improving the generalization of deep learning networks by the fusion of learned class-inherent transformations	May 17, 2020	Data AugmentationGeneral Classification	CodeCode Available	0
Target Speech Extraction Based on Blind Source Separation and X-vector-based Speaker Selection Trained with Data Augmentation	May 16, 2020	blind source separationData Augmentation	CodeCode Available	0
Leveraging Affective Bidirectional Transformers for Offensive Language Detection	May 16, 2020	Data AugmentationFeature Engineering	—Unverified	0
Speech Recognition and Multi-Speaker Diarization of Long Conversations	May 16, 2020	Data Augmentationspeaker-diarization	CodeCode Available	1
"I have vxxx bxx connexxxn!": Facing Packet Loss in Deep Speech Emotion Recognition	May 15, 2020	Data AugmentationEmotion Recognition	—Unverified	0
KEIS@JUST at SemEval-2020 Task 12: Identifying Multilingual Offensive Tweets Using Weighted Ensemble and Fine-Tuned BERT	May 15, 2020	Data AugmentationTransfer Learning	—Unverified	0
NAT: Noise-Aware Training for Robust Neural Sequence Labeling	May 14, 2020	Data Augmentationnamed-entity-recognition	CodeCode Available	1
Parallel Data Augmentation for Formality Style Transfer	May 14, 2020	Data AugmentationFormality Style Transfer	CodeCode Available	1
Data Augmentation for Deep Candlestick Learner	May 14, 2020	Data Augmentation	CodeCode Available	1
VirAAL: Virtual Adversarial Active Learning For NLU	May 14, 2020	Active LearningData Augmentation	CodeCode Available	0
You Do Not Need More Data: Improving End-To-End Speech Recognition by Text-To-Speech Data Augmentation	May 14, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
ODVICE: An Ontology-Driven Visual Analytic Tool for Interactive Cohort Extraction	May 13, 2020	Data Augmentation	—Unverified	0
Proxy Experience Replay: Federated Distillation for Distributed Reinforcement Learning	May 13, 2020	ClusteringData Augmentation	—Unverified	0
One-Shot Recognition of Manufacturing Defects in Steel Surfaces	May 12, 2020	Data AugmentationImage Classification	CodeCode Available	1
ECG-DelNet: Delineation of Ambulatory Electrocardiograms with Mixed Quality Labeling Using Neural Networks	May 11, 2020	Data AugmentationImage Segmentation	CodeCode Available	1
Towards Robustifying NLI Models Against Lexical Dataset Biases	May 10, 2020	Data AugmentationNatural Language Inference	CodeCode Available	0
A Simple Semi-Supervised Learning Framework for Object Detection	May 10, 2020	Data Augmentationimage-classification	CodeCode Available	1
AutoCLINT: The Winning Method in AutoCV Challenge 2019	May 9, 2020	BIG-bench Machine LearningData Augmentation	CodeCode Available	1
Deep Learning on Point Clouds for False Positive Reduction at Nodule Detection in Chest CT Scans	May 7, 2020	Data AugmentationMedical Image Analysis	—Unverified	0
Data Augmentation via Mixed Class Interpolation using Cycle-Consistent Generative Adversarial Networks Applied to Cross-Domain Imagery	May 5, 2020	ClassificationData Augmentation	—Unverified	0
Selecting Data Augmentation for Simulating Interventions	May 4, 2020	Data AugmentationDomain Generalization	CodeCode Available	1
Data Augmentation for Hypernymy Detection	May 4, 2020	Data Augmentation	CodeCode Available	0
Parkinson’s Disease EMG Data Augmentation and Simulation with DCGANs and Style Transfer	May 3, 2020	Data AugmentationElectromyography (EMG)	CodeCode Available	1
Self-Training with Improved Regularization for Sample-Efficient Chest X-Ray Classification	May 3, 2020	Data AugmentationDiagnostic	—Unverified	0
Correcting the Autocorrect: Context-Aware Typographical Error Correction via Training Data Augmentation	May 3, 2020	BIG-bench Machine LearningData Augmentation	—Unverified	0
A Causal View on Robustness of Neural Networks	May 3, 2020	Data Augmentation	—Unverified	0
SleepPoseNet: Multi-View Learning for Sleep Postural Transition Recognition Using UWB	May 2, 2020	Activity RecognitionData Augmentation	CodeCode Available	1
A Comprehensive Survey of Grammar Error Correction	May 2, 2020	Data AugmentationLanguage Modelling	—Unverified	0
On the Generalization Effects of Linear Transformations in Data Augmentation	May 2, 2020	Data Augmentationtext-classification	CodeCode Available	1
Teaching Machine Comprehension with Compositional Explanations	May 2, 2020	Data AugmentationMachine Reading Comprehension	CodeCode Available	1
Zero-Shot Transfer Learning with Synthesized Data for Multi-Domain Dialogue State Tracking	May 2, 2020	Data AugmentationDialogue State Tracking	CodeCode Available	1
Improving Non-autoregressive Neural Machine Translation with Monolingual Data	May 2, 2020	Data AugmentationKnowledge Distillation	—Unverified	0
Neural Symbolic Reader: Scalable Integration of Distributed and Symbolic Representations for Reading Comprehension	May 1, 2020	Data AugmentationMath	—Unverified	0
Stigma Annotation Scheme and Stigmatized Language Detection in Health-Care Discussions on Social Media	May 1, 2020	Data Augmentation	—Unverified	0
Getting More Data for Low-resource Morphological Inflection: Language Models and Data Augmentation	May 1, 2020	Data AugmentationDecoder	—Unverified	0
Multilingual Neural Machine Translation involving Indian Languages	May 1, 2020	Data AugmentationMachine Translation	—Unverified	0
Multiword Expression aware Neural Machine Translation	May 1, 2020	Data AugmentationMachine Translation	—Unverified	0
Data Augmentation using Machine Translation for Fake News Detection in the Urdu Language	May 1, 2020	ArticlesData Augmentation	—Unverified	0
Augmenting Small Data to Classify Contextualized Dialogue Acts for Exploratory Visualization	May 1, 2020	Data AugmentationData Visualization	—Unverified	0
When is Multi-task Learning Beneficial for Low-Resource Noisy Code-switched User-generated Algerian Texts?	May 1, 2020	Data AugmentationMulti-Task Learning	—Unverified	0
On the Benefits of Invariance in Neural Networks	May 1, 2020	Data Augmentation	—Unverified	0
Intra-model Variability in COVID-19 Classification Using Chest X-ray Images	Apr 30, 2020	Computed Tomography (CT)Data Augmentation	CodeCode Available	0
Aspect-Controlled Neural Argument Generation	Apr 30, 2020	Data AugmentationLanguage Modeling	CodeCode Available	1
Representations of Syntax [MASK] Useful: Effects of Constituency and Dependency Structure in Recursive LSTMs	Apr 30, 2020	Data Augmentation	CodeCode Available	0
Conditional Augmentation for Aspect Term Extraction via Masked Sequence-to-Sequence Generation	Apr 30, 2020	Data AugmentationExtract Aspect	—Unverified	0
Control, Generate, Augment: A Scalable Framework for Multi-Attribute Text Generation	Apr 30, 2020	AttributeData Augmentation	CodeCode Available	1
Does Data Augmentation Improve Generalization in NLP?	Apr 30, 2020	Data AugmentationFairness	—Unverified	0
Reinforcement Learning with Augmented Data	Apr 30, 2020	Data AugmentationOpenAI Gym	CodeCode Available	1
TextAttack: A Framework for Adversarial Attacks, Data Augmentation, and Adversarial Training in NLP	Apr 29, 2020	Adversarial AttackAdversarial Text	CodeCode Available	2

Show:10 25 50

← PrevPage 141 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified