Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3701–3750 of 8378 papers

Title	Date	Tasks	Status	Hype
Local Magnification for Data and Feature Augmentation	Nov 15, 2022	Data AugmentationDiversity	—Unverified	0
CST5: Data Augmentation for Code-Switched Semantic Parsing	Nov 14, 2022	Data AugmentationSemantic Parsing	CodeCode Available	1
Towards Robust Numerical Question Answering: Diagnosing Numerical Capabilities of NLP Systems	Nov 14, 2022	Data AugmentationOpen-Ended Question Answering	—Unverified	0
Hand gesture recognition using 802.11ad mmWave sensor in the mobile device	Nov 14, 2022	Data AugmentationGesture Recognition	—Unverified	0
Language Agnostic Code-Mixing Data Augmentation by Predicting Linguistic Patterns	Nov 14, 2022	Data AugmentationSentiment Analysis	—Unverified	0
The Potential of Neural Speech Synthesis-based Data Augmentation for Personalized Speech Enhancement	Nov 14, 2022	Data AugmentationSpeech Enhancement	—Unverified	0
A deep learning framework to generate realistic population and mobility data	Nov 14, 2022	Data Augmentation	—Unverified	0
Robustifying Deep Vision Models Through Shape Sensitization	Nov 14, 2022	ClassificationData Augmentation	—Unverified	0
Boosting Semi-Supervised 3D Object Detection with Semi-Sampling	Nov 14, 2022	3D Object DetectionData Augmentation	CodeCode Available	0
Adversarial and Random Transformations for Robust Domain Adaptation and Generalization	Nov 13, 2022	Data AugmentationDomain Adaptation	—Unverified	0
Textual Data Augmentation for Patient Outcomes Prediction	Nov 13, 2022	Data AugmentationLanguage Modeling	—Unverified	0
Improving the Robustness of DistilHuBERT to Unseen Noisy Conditions via Data Augmentation, Curriculum Learning, and Multi-Task Enhancement	Nov 12, 2022	Data AugmentationEmotion Recognition	—Unverified	0
Age Prediction Performance Varies Across Deep, Superficial, and Cerebellar White Matter Connections	Nov 11, 2022	Data Augmentation	—Unverified	0
MDFlow: Unsupervised Optical Flow Learning by Reliable Mutual Knowledge Distillation	Nov 11, 2022	BlockingData Augmentation	CodeCode Available	1
Masked Contrastive Representation Learning	Nov 11, 2022	Contrastive LearningData Augmentation	—Unverified	0
Equivariant Contrastive Learning for Sequential Recommendation	Nov 10, 2022	Contrastive LearningData Augmentation	CodeCode Available	0
MixUp-MIL: Novel Data Augmentation for Multiple Instance Learning and a Study on Thyroid Cancer Diagnosis	Nov 10, 2022	Data AugmentationMultiple Instance Learning	CodeCode Available	0
Scalable Modular Synthetic Data Generation for Advancing Aerial Autonomy	Nov 10, 2022	Data AugmentationSynthetic Data Generation	—Unverified	0
Impact of Adversarial Training on Robustness and Generalizability of Language Models	Nov 10, 2022	Data Augmentation	—Unverified	0
DisentQA: Disentangling Parametric and Contextual Knowledge with Counterfactual Question Answering	Nov 10, 2022	counterfactualData Augmentation	CodeCode Available	1
Training self-supervised peptide sequence models on artificially chopped proteins	Nov 9, 2022	Data AugmentationLanguage Modeling	—Unverified	0
Soft Augmentation for Image Classification	Nov 9, 2022	ClassificationData Augmentation	CodeCode Available	1
Extending Temporal Data Augmentation for Video Action Recognition	Nov 9, 2022	Action RecognitionData Augmentation	—Unverified	0
Combination of multiple neural networks using transfer learning and extensive geometric data augmentation for assessing cellularity scores in histopathology images	Nov 9, 2022	Data AugmentationTransfer Learning	—Unverified	0
Cold Start Streaming Learning for Deep Networks	Nov 9, 2022	Data Augmentation	—Unverified	0
IRNet: Iterative Refinement Network for Noisy Partial Label Learning	Nov 9, 2022	Data AugmentationPartial Label Learning	CodeCode Available	1
A Comparative Study of Data Augmentation Techniques for Deep Learning Based Emotion Recognition	Nov 9, 2022	Data AugmentationEmotion Recognition	—Unverified	0
GOOD-D: On Unsupervised Graph Out-Of-Distribution Detection	Nov 8, 2022	Contrastive LearningData Augmentation	CodeCode Available	1
Pushing the limits of self-supervised speaker verification using regularized distillation framework	Nov 8, 2022	Data AugmentationDiversity	—Unverified	0
Understanding the Role of Mixup in Knowledge Distillation: An Empirical Study	Nov 8, 2022	AttributeData Augmentation	CodeCode Available	0
Contrastive Learning with Prompt-derived Virtual Semantic Prototypes for Unsupervised Sentence Embedding	Nov 7, 2022	ClusteringContrastive Learning	CodeCode Available	0
Using Deep Mixture-of-Experts to Detect Word Meaning Shift for TempoWiC	Nov 7, 2022	Data AugmentationMixture-of-Experts	—Unverified	0
Contrastive Weighted Learning for Near-Infrared Gaze Estimation	Nov 6, 2022	Adversarial AttackContrastive Learning	—Unverified	0
Improved Techniques for the Conditional Generative Augmentation of Clinical Audio Data	Nov 5, 2022	Data Augmentation	—Unverified	0
Effective Audio Classification Network Based on Paired Inverse Pyramid Structure and Dense MLP Block	Nov 5, 2022	Audio ClassificationClassification	CodeCode Available	1
Unleashing the Power of Graph Data Augmentation on Covariate Distribution Shift	Nov 5, 2022	Data AugmentationGraph Classification	CodeCode Available	1
From Spelling to Grammar: A New Framework for Chinese Grammatical Error Correction	Nov 3, 2022	Data AugmentationGrammatical Error Correction	—Unverified	0
ImageNet-X: Understanding Model Mistakes with Factor of Variation Annotations	Nov 3, 2022	Data Augmentation	—Unverified	0
Transformers on Multilingual Clause-Level Morphology	Nov 3, 2022	Data AugmentationLanguage Modelling	CodeCode Available	0
Using U-Net Network for Efficient Brain Tumor Segmentation in MRI Images	Nov 3, 2022	Brain Tumor SegmentationData Augmentation	—Unverified	0
Evaluating a Synthetic Image Dataset Generated with Stable Diffusion	Nov 3, 2022	Data Augmentationimage-classification	—Unverified	0
Conditional Generative Models for Simulation of EMG During Naturalistic Movements	Nov 3, 2022	Data AugmentationTransfer Learning	CodeCode Available	1
Adversarial Data Augmentation Using VAE-GAN for Disordered Speech Recognition	Nov 3, 2022	Data AugmentationGenerative Adversarial Network	—Unverified	0
Adversarial Auto-Augment with Label Preservation: A Representation Learning Principle Guided Approach	Nov 2, 2022	Data AugmentationRepresentation Learning	CodeCode Available	0
Unsupervised Syntactically Controlled Paraphrase Generation with Abstract Meaning Representations	Nov 2, 2022	Data AugmentationDecoder	—Unverified	0
SpeechBlender: Speech Augmentation Framework for Mispronunciation Data Generation	Nov 2, 2022	Data AugmentationMulti-Task Learning	—Unverified	0
Style Augmentation improves Medical Image Segmentation	Nov 2, 2022	Data AugmentationImage Segmentation	—Unverified	0
Spatial Reasoning for Few-Shot Object Detection	Nov 2, 2022	Data AugmentationFew-Shot Object Detection	—Unverified	0
Joint Data and Feature Augmentation for Self-Supervised Representation Learning on Point Clouds	Nov 2, 2022	Contrastive LearningData Augmentation	—Unverified	0
Rethinking and Improving Robustness of Convolutional Neural Networks: a Shapley Value-based Approach in Frequency Domain	Nov 1, 2022	Adversarial AttackAdversarial Robustness	CodeCode Available	1

Show:10 25 50

← PrevPage 75 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified