Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6351–6400 of 8378 papers

Title	Date	Tasks	Status	Hype
Data InStance Prior (DISP) in Generative Adversarial Networks	Dec 8, 2020	Data AugmentationDiversity	—Unverified	0
Understanding How Dimension Reduction Tools Work: An Empirical Approach to Deciphering t-SNE, UMAP, TriMAP, and PaCMAP for Data Visualization	Dec 8, 2020	Data AugmentationData Visualization	CodeCode Available	1
Frame-level SpecAugment for Deep Convolutional Neural Networks in Hybrid ASR Systems	Dec 7, 2020	Data Augmentation	—Unverified	0
Dialogue Discourse-Aware Graph Model and Data Augmentation for Meeting Summarization	Dec 7, 2020	Data AugmentationMeeting Summarization	CodeCode Available	1
Unsupervised Pre-training for Person Re-identification	Dec 7, 2020	Data AugmentationPerson Re-Identification	CodeCode Available	1
VideoMix: Rethinking Data Augmentation for Video Classification	Dec 7, 2020	Action LocalizationAction Recognition	CodeCode Available	1
GenScan: A Generative Method for Populating Parametric 3D Scan Datasets	Dec 7, 2020	3D geometryData Augmentation	—Unverified	0
A Pseudo-labelling Auto-Encoder for unsupervised image classification	Dec 6, 2020	ClassificationData Augmentation	—Unverified	0
Dataset of Random Relaxations for Crystal Structure Search of Li-Si System	Dec 5, 2020	Data AugmentationDomain Generalization	—Unverified	0
What Makes a "Good" Data Augmentation in Knowledge Distillation -- A Statistical Perspective	Dec 5, 2020	Active LearningData Augmentation	CodeCode Available	1
Enhanced Offensive Language Detection Through Data Augmentation	Dec 5, 2020	Data AugmentationTask 2	—Unverified	0
Generating Synthetic Multispectral Satellite Imagery from Sentinel-2	Dec 5, 2020	BIG-bench Machine LearningData Augmentation	—Unverified	0
Data Boost: Text Data Augmentation Through Reinforcement Learning Guided Conditional Generation	Dec 5, 2020	Data Augmentationreinforcement-learning	—Unverified	0
Data-Efficient Methods for Dialogue Systems	Dec 5, 2020	Anomaly DetectionData Augmentation	—Unverified	0
Kernel-convoluted Deep Neural Networks with Data Augmentation	Dec 4, 2020	Data Augmentation	CodeCode Available	0
Delexicalized Paraphrase Generation	Dec 4, 2020	Data Augmentationintent-classification	—Unverified	0
Boosting offline handwritten text recognition in historical documents with few labeled lines	Dec 4, 2020	Data AugmentationHandwritten Text Recognition	—Unverified	0
Localization of Malaria Parasites and White Blood Cells in Thick Blood Smears	Dec 3, 2020	Data Augmentation	—Unverified	0
Aerial Imagery Pixel-level Segmentation	Dec 3, 2020	Data AugmentationSegmentation	CodeCode Available	1
Intervention Design for Effective Sim2Real Transfer	Dec 3, 2020	Causal InferenceData Augmentation	CodeCode Available	0
Multi-Label Contrastive Learning for Abstract Visual Reasoning	Dec 3, 2020	Contrastive LearningData Augmentation	CodeCode Available	0
Learning Two-Stream CNN for Multi-Modal Age-related Macular Degeneration Categorization	Dec 3, 2020	Data AugmentationImage Generation	CodeCode Available	1
FenceBox: A Platform for Defeating Adversarial Examples with Data Augmentation Techniques	Dec 3, 2020	Adversarial AttackData Augmentation	CodeCode Available	0
Red Blood Cell Segmentation with Overlapping Cell Separation and Classification on Imbalanced Dataset	Dec 2, 2020	Cell SegmentationClassification	CodeCode Available	1
Improved Contrastive Divergence Training of Energy Based Models	Dec 2, 2020	Data AugmentationImage Generation	CodeCode Available	1
How Robust are Randomized Smoothing based Defenses to Data Poisoning?	Dec 2, 2020	Adversarial RobustnessBilevel Optimization	—Unverified	0
A Self-Supervised Feature Map Augmentation (FMA) Loss and Combined Augmentations Finetuning to Efficiently Improve the Robustness of CNNs	Dec 2, 2020	Data Augmentationimage-classification	—Unverified	0
The ADAPT Centre’s Neural MT Systems for the WAT 2020 Document-Level Translation Task	Dec 1, 2020	Data AugmentationMachine Translation	—Unverified	0
TMU Japanese-English Multimodal Machine Translation System for WAT 2020	Dec 1, 2020	Data AugmentationDecoder	—Unverified	0
Chinese Grammatical Error Correction Based on Hybrid Models with Data Augmentation	Dec 1, 2020	Data AugmentationGrammatical Error Correction	—Unverified	0
Twitter Data Augmentation for Monitoring Public Opinion on COVID-19 Intervention Measures	Dec 1, 2020	Data Augmentation	—Unverified	0
FiNLP at FinCausal 2020 Task 1: Mixture of BERTs for Causal Sentence Identification in Financial Texts	Dec 1, 2020	Data AugmentationPosition	CodeCode Available	0
PhraseOut: A Code Mixed Data Augmentation Method for MultilingualNeural Machine Tranlsation	Dec 1, 2020	Data AugmentationMachine Translation	—Unverified	0
Arabic dialect identification: An Arabic-BERT model with data augmentation and ensembling strategy	Dec 1, 2020	Data AugmentationDialect Identification	—Unverified	0
Parallel resources for Tunisian Arabic Dialect Translation	Dec 1, 2020	Data AugmentationMachine Translation	—Unverified	0
SMM4H Shared Task 2020 - A Hybrid Pipeline for Identifying Prescription Drug Abuse from Twitter: Machine Learning, Deep Learning, and Post-Processing	Dec 1, 2020	Data AugmentationText Categorization	—Unverified	0
Medication Mention Detection in Tweets Using ELECTRA Transformers and Decision Trees	Dec 1, 2020	Data Augmentation	—Unverified	0
IMSurReal Too: IMS in the Surface Realization Shared Task 2020	Dec 1, 2020	Data Augmentation	CodeCode Available	0
ADAPT at SR’20: How Preprocessing and Data Augmentation Help to Improve Surface Realization	Dec 1, 2020	Data Augmentation	—Unverified	0
AraBench: Benchmarking Dialectal Arabic-English Machine Translation	Dec 1, 2020	BenchmarkingData Augmentation	—Unverified	0
Data Augmentation for Multiclass Utterance Classification -- A Systematic Study	Dec 1, 2020	ClassificationData Augmentation	—Unverified	0
Text Classification by Contrastive Learning and Cross-lingual Data Augmentation for Alzheimer's Disease Detection	Dec 1, 2020	Alzheimer's Disease DetectionContrastive Learning	—Unverified	0
Augmenting NLP models using Latent Feature Interpolations	Dec 1, 2020	Data AugmentationWord Embeddings	—Unverified	0
Towards building a Robust Industry-scale Question Answering System	Dec 1, 2020	Data AugmentationDiversity	—Unverified	0
Data Selection for Bilingual Lexicon Induction from Specialized Comparable Corpora	Dec 1, 2020	Bilingual Lexicon InductionData Augmentation	—Unverified	0
Scalable Cross-lingual Treebank Synthesis for Improved Production Dependency Parsers	Dec 1, 2020	Data Augmentation	—Unverified	0
Data Augmentation via Subtree Swapping for Dependency Parsing of Low-Resource Languages	Dec 1, 2020	Data AugmentationDependency Parsing	—Unverified	0
HateGAN: Adversarial Generative-Based Data Augmentation for Hate Speech Detection	Dec 1, 2020	Data AugmentationHate Speech Detection	—Unverified	0
Domain Transfer based Data Augmentation for Neural Query Translation	Dec 1, 2020	Cross-Lingual Information RetrievalData Augmentation	—Unverified	0
Unifying Input and Output Smoothing in Neural Machine Translation	Dec 1, 2020	Data AugmentationLanguage Modeling	—Unverified	0

Show:10 25 50

← PrevPage 128 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified