Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5051–5100 of 8378 papers

Title	Date	Tasks	Status
Universal Adaptive Data Augmentation	Jul 14, 2022	Data Augmentationimage-classification	—Unverified
Attention, Filling in The Gaps for Generalization in Routing Problems	Jul 14, 2022	Data Augmentation	—Unverified
Data Augmentation for Low-Resource Quechua ASR Improvement	Jul 14, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Neural Data-to-Text Generation Based on Small Datasets: Comparing the Added Value of Two Semi-Supervised Learning Approaches on Top of a Large Language Model	Jul 14, 2022	Data AugmentationData-to-Text Generation	—Unverified
Deepfake Video Detection with Spatiotemporal Dropout Transformer	Jul 14, 2022	Data AugmentationFace Swapping	—Unverified
Developing a Component Comment Extractor from Product Reviews on E-Commerce Sites	Jul 13, 2022	Data Augmentation	—Unverified
Fine-tuning Partition-aware Item Similarities for Efficient and Scalable Recommendation	Jul 13, 2022	Collaborative FilteringData Augmentation	CodeCode Available
Efficient Augmentation for Imbalanced Deep Learning	Jul 13, 2022	Data AugmentationDeep Learning	CodeCode Available
Building Korean Sign Language Augmentation (KoSLA) Corpus with Data Augmentation Technique	Jul 12, 2022	Data AugmentationSign Language Translation	—Unverified
Label-Efficient Self-Supervised Speaker Verification With Information Maximization and Contrastive Learning	Jul 12, 2022	Contrastive LearningData Augmentation	—Unverified
Know Your Space: Inlier and Outlier Construction for Calibrating Medical OOD Detectors	Jul 12, 2022	Data AugmentationOpen Set Learning	—Unverified
Brain-Aware Replacements for Supervised Contrastive Learning in Detection of Alzheimer's Disease	Jul 11, 2022	Contrastive LearningData Augmentation	CodeCode Available
Bootstrapping a User-Centered Task-Oriented Dialogue System	Jul 11, 2022	Data AugmentationDialogue Management	—Unverified
Automating Detection of Papilledema in Pediatric Fundus Images with Explainable Machine Learning	Jul 10, 2022	BIG-bench Machine LearningData Augmentation	CodeCode Available
Training Robust Deep Models for Time-Series Domain: Novel Algorithms and Theoretical Analysis	Jul 9, 2022	Data AugmentationDynamic Time Warping	CodeCode Available
Unsupervised Joint Image Transfer and Uncertainty Quantification Using Patch Invariant Networks	Jul 9, 2022	Data AugmentationUncertainty Quantification	CodeCode Available
UDRN: Unified Dimensional Reduction Neural Network for Feature Selection and Feature Projection	Jul 8, 2022	Data AugmentationDimensionality Reduction	—Unverified
On Improving the Performance of Glitch Classification for Gravitational Wave Detection by using Generative Adversarial Networks	Jul 8, 2022	ClassificationData Augmentation	—Unverified
How many perturbations break this model? Evaluating robustness beyond adversarial accuracy	Jul 8, 2022	Adversarial AttackAdversarial Robustness	CodeCode Available
Models Out of Line: A Fourier Lens on Distribution Shift Robustness	Jul 8, 2022	Data Augmentation	—Unverified
StatMix: Data augmentation method that relies on image statistics in federated learning	Jul 8, 2022	Data AugmentationFederated Learning	—Unverified
Harnessing Out-Of-Distribution Examples via Augmenting Content and Style	Jul 7, 2022	Data AugmentationDisentanglement	CodeCode Available
Supervised Contrastive Learning Approach for Contextual Ranking	Jul 7, 2022	Contrastive LearningData Augmentation	—Unverified
Don't overfit the history -- Recursive time series data augmentation	Jul 6, 2022	Data AugmentationTime Series	—Unverified
Monkeypox Skin Lesion Detection Using Deep Learning Models: A Feasibility Study	Jul 6, 2022	Data AugmentationLesion Detection	—Unverified
Towards Length-Versatile and Noise-Robust Radio Frequency Fingerprint Identification	Jul 6, 2022	Data Augmentation	—Unverified
Generalization to translation shifts: a study in architectures and augmentations	Jul 5, 2022	Data Augmentationimage-classification	—Unverified
Predicting Out-of-Domain Generalization with Neighborhood Invariance	Jul 5, 2022	Data AugmentationDomain Generalization	—Unverified
DBN-Mix: Training Dual Branch Network Using Bilateral Mixup Augmentation for Long-Tailed Visual Recognition	Jul 5, 2022	Data AugmentationDiversity	—Unverified
TractoFormer: A Novel Fiber-level Whole Brain Tractography Analysis Framework Using Spectral Embedding and Vision Transformers	Jul 5, 2022	Data AugmentationDiffusion MRI	—Unverified
Block-SCL: Blocking Matters for Supervised Contrastive Learning in Product Matching	Jul 5, 2022	BlockingContrastive Learning	—Unverified
A Robust Ensemble Model for Patasitic Egg Detection and Classification	Jul 4, 2022	ClassificationData Augmentation	—Unverified
FakeNews: GAN-based generation of realistic 3D volumetric data -- A systematic review and taxonomy	Jul 4, 2022	Data Augmentation	—Unverified
Efficient Semi-supervised Consistency Training for Natural Language Understanding	Jul 1, 2022	Data Augmentationdomain classification	—Unverified
SPDB Innovation Lab at SemEval-2022 Task 10: A Novel End-to-End Structured Sentiment Analysis Model based on the ERNIE-M	Jul 1, 2022	Data AugmentationLanguage Modeling	—Unverified
SemEval-2022 Task 3: PreTENS-Evaluating Neural Networks on Presuppositional Semantic Knowledge	Jul 1, 2022	Data Augmentation	—Unverified
CASIA at SemEval-2022 Task 11: Chinese Named Entity Recognition for Complex and Ambiguous Entities	Jul 1, 2022	Chinese Named Entity RecognitionData Augmentation	—Unverified
Learning to Generate Examples for Semantic Processing Tasks	Jul 1, 2022	Data AugmentationNatural Language Inference	—Unverified
Amsqr at SemEval-2022 Task 4: Towards AutoNLP via Meta-Learning and Adversarial Data Augmentation for PCL Detection	Jul 1, 2022	Binary ClassificationData Augmentation	—Unverified
Infrrd.ai at SemEval-2022 Task 11: A system for named entity recognition using data augmentation, transformer-based sequence labeling model, and EnsembleCRF	Jul 1, 2022	Data AugmentationLanguage Modeling	—Unverified
Compositional Generalization for Kinship Prediction through Data Augmentation	Jul 1, 2022	Data AugmentationPrediction	—Unverified
IIIT-MLNS at SemEval-2022 Task 8: Siamese Architecture for Modeling Multilingual News Similarity	Jul 1, 2022	ArticlesData Augmentation	—Unverified
I2C at SemEval-2022 Task 4: Patronizing and Condescending Language Detection using Deep Learning Techniques	Jul 1, 2022	Data AugmentationDeep Learning	—Unverified
Improving Classification of Infrequent Cognitive Distortions: Domain-Specific Model vs. Data Augmentation	Jul 1, 2022	Data AugmentationLanguage Modeling	—Unverified
Visual Transformer Meets CutMix for Improved Accuracy, Communication Efficiency, and Data Privacy in Split Learning	Jul 1, 2022	Data AugmentationFederated Learning	—Unverified
Retrieval Based Response Letter Generation For a Customer Care Setting	Jul 1, 2022	Data AugmentationManagement	—Unverified
Data Augmentation for Low-Resource Dialogue Summarization	Jul 1, 2022	Data AugmentationMeeting Summarization	—Unverified
UA-KO at SemEval-2022 Task 11: Data Augmentation and Ensembles for Korean Named Entity Recognition	Jul 1, 2022	Data Augmentationnamed-entity-recognition	—Unverified
BIT-Xiaomi’s System for AutoSimTrans 2022	Jul 1, 2022	ChunkingData Augmentation	—Unverified
Fast Bilingual Grapheme-To-Phoneme Conversion	Jul 1, 2022	Data AugmentationGrapheme-to-Phoneme Conversion	—Unverified

Show:10 25 50

← PrevPage 102 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified