Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6701–6750 of 8378 papers

Title	Date	Tasks	Status
Delexicalized Paraphrase Generation	Dec 4, 2020	Data Augmentationintent-classification	—Unverified
Localization of Malaria Parasites and White Blood Cells in Thick Blood Smears	Dec 3, 2020	Data Augmentation	—Unverified
FenceBox: A Platform for Defeating Adversarial Examples with Data Augmentation Techniques	Dec 3, 2020	Adversarial AttackData Augmentation	CodeCode Available
Multi-Label Contrastive Learning for Abstract Visual Reasoning	Dec 3, 2020	Contrastive LearningData Augmentation	CodeCode Available
Intervention Design for Effective Sim2Real Transfer	Dec 3, 2020	Causal InferenceData Augmentation	CodeCode Available
How Robust are Randomized Smoothing based Defenses to Data Poisoning?	Dec 2, 2020	Adversarial RobustnessBilevel Optimization	—Unverified
A Self-Supervised Feature Map Augmentation (FMA) Loss and Combined Augmentations Finetuning to Efficiently Improve the Robustness of CNNs	Dec 2, 2020	Data Augmentationimage-classification	—Unverified
Chinese Grammatical Error Correction Based on Hybrid Models with Data Augmentation	Dec 1, 2020	Data AugmentationGrammatical Error Correction	—Unverified
SkoltechNLP at SemEval-2020 Task 11: Exploring Unsupervised Text Augmentation for Propaganda Detection	Dec 1, 2020	ArticlesData Augmentation	—Unverified
Denoising Pre-Training and Data Augmentation Strategies for Enhanced RDF Verbalization with Transformers	Dec 1, 2020	Data AugmentationDenoising	—Unverified
Augmenting NLP models using Latent Feature Interpolations	Dec 1, 2020	Data AugmentationWord Embeddings	—Unverified
SMM4H Shared Task 2020 - A Hybrid Pipeline for Identifying Prescription Drug Abuse from Twitter: Machine Learning, Deep Learning, and Post-Processing	Dec 1, 2020	Data AugmentationText Categorization	—Unverified
Deep Subspace Clustering with Data Augmentation	Dec 1, 2020	ClusteringData Augmentation	—Unverified
TMU Japanese-English Multimodal Machine Translation System for WAT 2020	Dec 1, 2020	Data AugmentationDecoder	—Unverified
BLCU-NLP at SemEval-2020 Task 5: Data Augmentation for Efficient Counterfactual Detecting	Dec 1, 2020	Common Sense Reasoningcounterfactual	—Unverified
Post-training Iterative Hierarchical Data Augmentation for Deep Networks	Dec 1, 2020	Activity RecognitionData Augmentation	—Unverified
Medication Mention Detection in Tweets Using ELECTRA Transformers and Decision Trees	Dec 1, 2020	Data Augmentation	—Unverified
PhraseOut: A Code Mixed Data Augmentation Method for MultilingualNeural Machine Tranlsation	Dec 1, 2020	Data AugmentationMachine Translation	—Unverified
XSYSIGMA at SemEval-2020 Task 7: Method for Predicting Headlines' Humor Based on Auxiliary Sentences with EI-BERT	Dec 1, 2020	Data AugmentationPseudo Label	—Unverified
Improving Grammatical Error Correction with Data Augmentation by Editing Latent Representation	Dec 1, 2020	Data AugmentationDiversity	—Unverified
Scalable Cross-lingual Treebank Synthesis for Improved Production Dependency Parsers	Dec 1, 2020	Data Augmentation	—Unverified
Heterogeneous Recycle Generation for Chinese Grammatical Error Correction	Dec 1, 2020	Data AugmentationGrammatical Error Correction	—Unverified
Parallel resources for Tunisian Arabic Dialect Translation	Dec 1, 2020	Data AugmentationMachine Translation	—Unverified
Unifying Input and Output Smoothing in Neural Machine Translation	Dec 1, 2020	Data AugmentationLanguage Modeling	—Unverified
The ADAPT Centre’s Neural MT Systems for the WAT 2020 Document-Level Translation Task	Dec 1, 2020	Data AugmentationMachine Translation	—Unverified
HateGAN: Adversarial Generative-Based Data Augmentation for Hate Speech Detection	Dec 1, 2020	Data AugmentationHate Speech Detection	—Unverified
Automatically Identifying Language Family from Acoustic Examples in Low Resource Scenarios	Dec 1, 2020	Data Augmentation	CodeCode Available
Towards building a Robust Industry-scale Question Answering System	Dec 1, 2020	Data AugmentationDiversity	—Unverified
Improving Spoken Language Understanding by Wisdom of Crowds	Dec 1, 2020	Data AugmentationSpoken Language Understanding	—Unverified
AlexU-BackTranslation-TL at SemEval-2020 Task 12: Improving Offensive Language Detection Using Data Augmentation and Transfer Learning	Dec 1, 2020	Data AugmentationLanguage Identification	—Unverified
WUY at SemEval-2020 Task 7: Combining BERT and Naive Bayes-SVM for Humor Assessment in Edited News Headlines	Dec 1, 2020	Data Augmentationregression	—Unverified
Text Classification by Contrastive Learning and Cross-lingual Data Augmentation for Alzheimer's Disease Detection	Dec 1, 2020	Alzheimer's Disease DetectionContrastive Learning	—Unverified
WMD at SemEval-2020 Tasks 7 and 11: Assessing Humor and Propaganda Using Unsupervised Data Augmentation	Dec 1, 2020	Data Augmentation	—Unverified
IMSurReal Too: IMS in the Surface Realization Shared Task 2020	Dec 1, 2020	Data Augmentation	CodeCode Available
One-sample Guided Object Representation Disassembling	Dec 1, 2020	Data Augmentationimage-classification	—Unverified
FiNLP at FinCausal 2020 Task 1: Mixture of BERTs for Causal Sentence Identification in Financial Texts	Dec 1, 2020	Data AugmentationPosition	CodeCode Available
Data Augmentation for Multiclass Utterance Classification -- A Systematic Study	Dec 1, 2020	ClassificationData Augmentation	—Unverified
Twitter Data Augmentation for Monitoring Public Opinion on COVID-19 Intervention Measures	Dec 1, 2020	Data Augmentation	—Unverified
Domain Transfer based Data Augmentation for Neural Query Translation	Dec 1, 2020	Cross-Lingual Information RetrievalData Augmentation	—Unverified
Arabic dialect identification: An Arabic-BERT model with data augmentation and ensembling strategy	Dec 1, 2020	Data AugmentationDialect Identification	—Unverified
A Generative Model to Synthesize EEG Data for Epileptic Seizure Prediction	Dec 1, 2020	Data AugmentationEEG	—Unverified
Data Selection for Bilingual Lexicon Induction from Specialized Comparable Corpora	Dec 1, 2020	Bilingual Lexicon InductionData Augmentation	—Unverified
AraBench: Benchmarking Dialectal Arabic-English Machine Translation	Dec 1, 2020	BenchmarkingData Augmentation	—Unverified
ADAPT at SR’20: How Preprocessing and Data Augmentation Help to Improve Surface Realization	Dec 1, 2020	Data Augmentation	—Unverified
Data Augmentation via Subtree Swapping for Dependency Parsing of Low-Resource Languages	Dec 1, 2020	Data AugmentationDependency Parsing	—Unverified
A Customizable Dynamic Scenario Modeling and Data Generation Platform for Autonomous Driving	Nov 30, 2020	Autonomous DrivingData Augmentation	—Unverified
What Can Style Transfer and Paintings Do For Model Robustness?	Nov 30, 2020	Data AugmentationStyle Transfer	CodeCode Available
Anchored-STFT and GNAA: An extension of STFT in conjunction with an adversarial data augmentation technique for the decoding of neural signals	Nov 30, 2020	ClassificationData Augmentation	—Unverified
Rethinking and Designing a High-performing Automatic License Plate Recognition Approach	Nov 30, 2020	Data AugmentationLicense Plate Detection	—Unverified
Automated Prostate Cancer Diagnosis Based on Gleason Grading Using Convolutional Neural Network	Nov 29, 2020	Data AugmentationDiagnostic	—Unverified

Show:10 25 50

← PrevPage 135 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified