Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6101–6150 of 8378 papers

Title	Date	Tasks	Status
SimCVD: Simple Contrastive Voxel-Wise Representation Distillation for Semi-Supervised Medical Image Segmentation	Aug 13, 2021	Data AugmentationImage Generation	—Unverified
Cascade Bagging for Accuracy Prediction with Few Training Samples	Aug 12, 2021	Data AugmentationEnsemble Learning	CodeCode Available
Log-Spectral Matching GAN: PPG-based Atrial Fibrillation Detection can be Enhanced by GAN-based Data Augmentation with Integration of Spectral Loss	Aug 11, 2021	Atrial Fibrillation DetectionData Augmentation	CodeCode Available
An empirical investigation into audio pipeline approaches for classifying bird species	Aug 10, 2021	Audio ClassificationClassification	—Unverified
InfoGAN-MSF: a data augmentation approach for correlative bridge monitoring factors	Aug 9, 2021	Data Augmentation	—Unverified
Towards artificially intelligent recycling Improving image processing for waste classification	Aug 9, 2021	ClassificationData Augmentation	—Unverified
Triplet Contrastive Learning for Brain Tumor Classification	Aug 8, 2021	Brain Tumor ClassificationClassification	—Unverified
Impact of Aliasing on Generalization in Deep Convolutional Networks	Aug 7, 2021	Data AugmentationFew-Shot Learning	—Unverified
Ensemble Augmentation for Deep Neural Networks Using 1-D Time Series Vibration Data	Aug 6, 2021	Data AugmentationGenerative Adversarial Network	CodeCode Available
High-frequency shape recovery from shading by CNN and domain adaptation	Aug 6, 2021	Data AugmentationDomain Adaptation	—Unverified
Distilling Transformers for Neural Cross-Domain Search	Aug 6, 2021	Code SearchData Augmentation	—Unverified
Offensive Language and Hate Speech Detection with Deep Learning and Transfer Learning	Aug 6, 2021	Data AugmentationHate Speech Detection	—Unverified
Automatic Rail Component Detection Based on AttnConv-Net	Aug 5, 2021	Data Augmentation	—Unverified
Exploring Structure Consistency for Deep Model Watermarking	Aug 5, 2021	Data Augmentationmodel	—Unverified
Locally Interpretable One-Class Anomaly Detection for Credit Card Fraud Detection	Aug 5, 2021	Anomaly DetectionData Augmentation	CodeCode Available
Alleviating Mode Collapse in GAN via Diversity Penalty Module	Aug 5, 2021	Data AugmentationDiversity	—Unverified
Pervasive Hand Gesture Recognition for Smartphones using Non-audible Sound and Deep Learning	Aug 4, 2021	Data AugmentationGesture Recognition	—Unverified
MRI to PET Cross-Modality Translation using Globally and Locally Aware GAN (GLA-GAN) for Multi-Modal Diagnosis of Alzheimer's Disease	Aug 4, 2021	Data AugmentationImage-to-Image Translation	—Unverified
Lung Sound Classification Using Co-tuning and Stochastic Normalization	Aug 4, 2021	Audio ClassificationData Augmentation	—Unverified
Terabyte-scale supervised 3D training and benchmarking dataset of the mouse kidney	Aug 4, 2021	BenchmarkingBIG-bench Machine Learning	—Unverified
CPSC: Conformal prediction with shrunken centroids for efficient prediction reliability quantification and data augmentation, a case in alternative herbal medicine classification with electronic nose	Aug 2, 2021	Conformal PredictionData Augmentation	—Unverified
Adversarial Data Augmentation for Disordered Speech Recognition	Aug 2, 2021	Data Augmentationspeech-recognition	—Unverified
Semi-Supervising Learning, Transfer Learning, and Knowledge Distillation with SimCLR	Aug 2, 2021	Data AugmentationKnowledge Distillation	—Unverified
Changes in European Solidarity Before and During COVID-19: Evidence from a Large Crowd- and Expert-Annotated Twitter Dataset	Aug 2, 2021	Data Augmentation	CodeCode Available
Cambridge at SemEval-2021 Task 2: Neural WiC-Model with Data Augmentation and Exploration of Representation	Aug 1, 2021	Data AugmentationLanguage Modeling	—Unverified
MulDA: A Multilingual Data Augmentation Framework for Low-Resource Cross-Lingual NER	Aug 1, 2021	Cross-Lingual NERCross-Lingual Transfer	—Unverified
LIORI at SemEval-2021 Task 2: Span Prediction and Binary Classification approaches to Word-in-Context Disambiguation	Aug 1, 2021	Binary ClassificationData Augmentation	—Unverified
OoMMix: Out-of-manifold Regularization in Contextual Embedding Space for Text Classification	Aug 1, 2021	Data Augmentationtext-classification	—Unverified
ANVITA Machine Translation System for WAT 2021 MultiIndicMT Shared Task	Aug 1, 2021	Data AugmentationDecoder	—Unverified
Data augmentation for low-resource grapheme-to-phoneme mapping	Aug 1, 2021	Data Augmentation	—Unverified
PAW at SemEval-2021 Task 2: Multilingual and Cross-lingual Word-in-Context Disambiguation : Exploring Cross Lingual Transfer, Augmentations and Adversarial Training	Aug 1, 2021	Binary ClassificationCross-Lingual Transfer	—Unverified
Multilingual Speech Translation with Unified Transformer: Huawei Noah’s Ark Lab at IWSLT 2021	Aug 1, 2021	Data AugmentationDecoder	—Unverified
基于字词粒度噪声数据增强的中文语法纠错(Chinese Grammatical Error Correction enhanced by Data Augmentation from Word and Character Levels)	Aug 1, 2021	Data AugmentationGrammatical Error Correction	—Unverified
Building Goal-oriented Document-grounded Dialogue Systems	Aug 1, 2021	Data AugmentationResponse Generation	—Unverified
Team “NoConflict” at CASE 2021 Task 1: Pretraining for Sentence-Level Protest Event Detection	Aug 1, 2021	ArticlesData Augmentation	—Unverified
Data Augmentation with Adversarial Training for Cross-Lingual NLI	Aug 1, 2021	Cross-Lingual Natural Language InferenceData Augmentation	—Unverified
DeepBlueAI at SemEval-2021 Task 1: Lexical Complexity Prediction with A Deep Ensemble Approach	Aug 1, 2021	Data AugmentationLexical Complexity Prediction	—Unverified
VL-BERT+: Detecting Protected Groups in Hateful Multimodal Memes	Aug 1, 2021	Data AugmentationHateful Meme Classification	—Unverified
mixSeq: A Simple Data Augmentation Methodfor Neural Machine Translation	Aug 1, 2021	Data AugmentationDiversity	—Unverified
The University of Arizona at SemEval-2021 Task 10: Applying Self-training, Active Learning and Data Augmentation to Source-free Domain Adaptation	Aug 1, 2021	Active LearningData Augmentation	—Unverified
IITK at SemEval-2021 Task 10: Source-Free Unsupervised Domain Adaptation using Class Prototypes	Aug 1, 2021	Data AugmentationDomain Adaptation	—Unverified
HiddenCut: Simple Data Augmentation for Natural Language Understanding with Better Generalizability	Aug 1, 2021	Data AugmentationNatural Language Understanding	CodeCode Available
Discriminative Reranking for Neural Machine Translation	Aug 1, 2021	Data AugmentationMachine Translation	—Unverified
IMS’ Systems for the IWSLT 2021 Low-Resource Speech Translation Task	Aug 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Low-Resource Named Entity Recognition via Label-Aware Data Augmentation and Curriculum Denoising	Aug 1, 2021	Data AugmentationDenoising	—Unverified
Technical Report on Shared Task in DialDoc21	Aug 1, 2021	Data Augmentation	—Unverified
BME Submission for SIGMORPHON 2021 Shared Task 0. A Three Step Training Approach with Data Augmentation for Morphological Inflection	Aug 1, 2021	Data AugmentationDecoder	—Unverified
NLPIITR at SemEval-2021 Task 6: RoBERTa Model with Data Augmentation for Persuasion Techniques Detection	Aug 1, 2021	Data Augmentation	—Unverified
LeCun at SemEval-2021 Task 6: Detecting Persuasion Techniques in Text Using Ensembled Pretrained Transformers and Data Augmentation	Aug 1, 2021	Data Augmentation	—Unverified
Improved English to Hindi Multimodal Neural Machine Translation	Aug 1, 2021	Data AugmentationMachine Translation	—Unverified

Show:10 25 50

← PrevPage 123 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified