Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5551–5600 of 8378 papers

Title	Date	Tasks	Status	Hype
Triplet Contrastive Learning for Brain Tumor Classification	Aug 8, 2021	Brain Tumor ClassificationClassification	—Unverified	0
Enhancing MR Image Segmentation with Realistic Adversarial Data Augmentation	Aug 7, 2021	Cardiac SegmentationData Augmentation	CodeCode Available	1
Impact of Aliasing on Generalization in Deep Convolutional Networks	Aug 7, 2021	Data AugmentationFew-Shot Learning	—Unverified	0
Ensemble Augmentation for Deep Neural Networks Using 1-D Time Series Vibration Data	Aug 6, 2021	Data AugmentationGenerative Adversarial Network	CodeCode Available	0
High-frequency shape recovery from shading by CNN and domain adaptation	Aug 6, 2021	Data AugmentationDomain Adaptation	—Unverified	0
Improving Contrastive Learning by Visualizing Feature Transformation	Aug 6, 2021	Contrastive LearningData Augmentation	CodeCode Available	1
Distilling Transformers for Neural Cross-Domain Search	Aug 6, 2021	Code SearchData Augmentation	—Unverified	0
Offensive Language and Hate Speech Detection with Deep Learning and Transfer Learning	Aug 6, 2021	Data AugmentationHate Speech Detection	—Unverified	0
Exploring Structure Consistency for Deep Model Watermarking	Aug 5, 2021	Data Augmentationmodel	—Unverified	0
Automatic Rail Component Detection Based on AttnConv-Net	Aug 5, 2021	Data Augmentation	—Unverified	0
Alleviating Mode Collapse in GAN via Diversity Penalty Module	Aug 5, 2021	Data AugmentationDiversity	—Unverified	0
Locally Interpretable One-Class Anomaly Detection for Credit Card Fraud Detection	Aug 5, 2021	Anomaly DetectionData Augmentation	CodeCode Available	0
Pervasive Hand Gesture Recognition for Smartphones using Non-audible Sound and Deep Learning	Aug 4, 2021	Data AugmentationGesture Recognition	—Unverified	0
Terabyte-scale supervised 3D training and benchmarking dataset of the mouse kidney	Aug 4, 2021	BenchmarkingBIG-bench Machine Learning	—Unverified	0
MRI to PET Cross-Modality Translation using Globally and Locally Aware GAN (GLA-GAN) for Multi-Modal Diagnosis of Alzheimer's Disease	Aug 4, 2021	Data AugmentationImage-to-Image Translation	—Unverified	0
Lung Sound Classification Using Co-tuning and Stochastic Normalization	Aug 4, 2021	Audio ClassificationData Augmentation	—Unverified	0
A Study of Multilingual End-to-End Speech Recognition for Kazakh, Russian, and English	Aug 3, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
The Devil is in the GAN: Backdoor Attacks and Defenses in Deep Generative Models	Aug 3, 2021	BIG-bench Machine LearningData Augmentation	CodeCode Available	1
CPSC: Conformal prediction with shrunken centroids for efficient prediction reliability quantification and data augmentation, a case in alternative herbal medicine classification with electronic nose	Aug 2, 2021	Conformal PredictionData Augmentation	—Unverified	0
Adversarial Data Augmentation for Disordered Speech Recognition	Aug 2, 2021	Data Augmentationspeech-recognition	—Unverified	0
Changes in European Solidarity Before and During COVID-19: Evidence from a Large Crowd- and Expert-Annotated Twitter Dataset	Aug 2, 2021	Data Augmentation	CodeCode Available	0
Semi-Supervising Learning, Transfer Learning, and Knowledge Distillation with SimCLR	Aug 2, 2021	Data AugmentationKnowledge Distillation	—Unverified	0
Robust Semantic Segmentation with Superpixel-Mix	Aug 2, 2021	Data AugmentationSegmentation	CodeCode Available	1
Building Goal-oriented Document-grounded Dialogue Systems	Aug 1, 2021	Data AugmentationResponse Generation	—Unverified	0
Technical Report on Shared Task in DialDoc21	Aug 1, 2021	Data Augmentation	—Unverified	0
CAiRE in DialDoc21: Data Augmentation for Information Seeking Dialogue System	Aug 1, 2021	Data AugmentationResponse Generation	CodeCode Available	1
Maastricht University’s Multilingual Speech Translation System for IWSLT 2021	Aug 1, 2021	Data AugmentationTranslation	—Unverified	0
Multilingual Speech Translation with Unified Transformer: Huawei Noah’s Ark Lab at IWSLT 2021	Aug 1, 2021	Data AugmentationDecoder	—Unverified	0
ALEM at CASE 2021 Task 1: Multilingual Text Classification on News Articles	Aug 1, 2021	ArticlesData Augmentation	—Unverified	0
IMS’ Systems for the IWSLT 2021 Low-Resource Speech Translation Task	Aug 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Without Further Ado: Direct and Simultaneous Speech Translation by AppTek in 2021	Aug 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Edinburgh’s End-to-End Multilingual Speech Translation System for IWSLT 2021	Aug 1, 2021	Data Augmentationfeature selection	—Unverified	0
Team “NoConflict” at CASE 2021 Task 1: Pretraining for Sentence-Level Protest Event Detection	Aug 1, 2021	ArticlesData Augmentation	—Unverified	0
mixSeq: A Simple Data Augmentation Methodfor Neural Machine Translation	Aug 1, 2021	Data AugmentationDiversity	—Unverified	0
BME Submission for SIGMORPHON 2021 Shared Task 0. A Three Step Training Approach with Data Augmentation for Morphological Inflection	Aug 1, 2021	Data AugmentationDecoder	—Unverified	0
Data augmentation for low-resource grapheme-to-phoneme mapping	Aug 1, 2021	Data Augmentation	—Unverified	0
Better Robustness by More Coverage: Adversarial and Mixup Data Augmentation for Robust Finetuning	Aug 1, 2021	Data Augmentation	CodeCode Available	1
Product Review Translation using Phrase Replacement and Attention Guided Noise Augmentation	Aug 1, 2021	Data AugmentationMachine Translation	—Unverified	0
Improving Low-Resource Named Entity Recognition via Label-Aware Data Augmentation and Curriculum Denoising	Aug 1, 2021	Data AugmentationDenoising	—Unverified	0
基于字词粒度噪声数据增强的中文语法纠错(Chinese Grammatical Error Correction enhanced by Data Augmentation from Word and Character Levels)	Aug 1, 2021	Data AugmentationGrammatical Error Correction	—Unverified	0
Improved English to Hindi Multimodal Neural Machine Translation	Aug 1, 2021	Data AugmentationMachine Translation	—Unverified	0
ANVITA Machine Translation System for WAT 2021 MultiIndicMT Shared Task	Aug 1, 2021	Data AugmentationDecoder	—Unverified	0
VL-BERT+: Detecting Protected Groups in Hateful Multimodal Memes	Aug 1, 2021	Data AugmentationHateful Meme Classification	—Unverified	0
MulDA: A Multilingual Data Augmentation Framework for Low-Resource Cross-Lingual NER	Aug 1, 2021	Cross-Lingual NERCross-Lingual Transfer	—Unverified	0
NLPIITR at SemEval-2021 Task 6: RoBERTa Model with Data Augmentation for Persuasion Techniques Detection	Aug 1, 2021	Data Augmentation	—Unverified	0
Exploring Listwise Evidence Reasoning with T5 for Fact Verification	Aug 1, 2021	Data AugmentationFact Verification	—Unverified	0
HiddenCut: Simple Data Augmentation for Natural Language Understanding with Better Generalizability	Aug 1, 2021	Data AugmentationNatural Language Understanding	CodeCode Available	0
Avoiding Overlap in Data Augmentation for AMR-to-Text Generation	Aug 1, 2021	AMR-to-Text GenerationData Augmentation	—Unverified	0
FPAI at SemEval-2021 Task 6: BERT-MRC for Propaganda Techniques Detection	Aug 1, 2021	Data AugmentationQuestion Answering	—Unverified	0
Continuous Language Generative Flow	Aug 1, 2021	Data AugmentationDensity Estimation	CodeCode Available	1

Show:10 25 50

← PrevPage 112 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified