Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3751–3800 of 8378 papers

Title	Date	Tasks	Status	Hype
CrowNER at Rocling 2022 Shared Task: NER using MacBERT and Adversarial Training	Nov 1, 2022	Data Augmentationnamed-entity-recognition	—Unverified	0
Why is Winoground Hard? Investigating Failures in Visuolinguistic Compositionality	Nov 1, 2022	Data AugmentationImage Retrieval	CodeCode Available	1
Towards Better Out-of-Distribution Generalization of Neural Algorithmic Reasoning Tasks	Nov 1, 2022	Data AugmentationGraph Neural Network	CodeCode Available	1
Augmentation Invariant Manifold Learning	Nov 1, 2022	Data AugmentationRepresentation Learning	—Unverified	0
Self-supervised Character-to-Character Distillation for Text Recognition	Nov 1, 2022	Data AugmentationRepresentation Learning	CodeCode Available	1
SADT: Combining Sharpness-Aware Minimization with Self-Distillation for Improved Model Generalization	Nov 1, 2022	Data Augmentation	CodeCode Available	0
Exploring Train and Test-Time Augmentations for Audio-Language Learning	Oct 31, 2022	Audio captioningAudio to Text Retrieval	—Unverified	0
1Cademy @ Causal News Corpus 2022: Enhance Causal Span Detection via Beam-Search-based Position Selector	Oct 31, 2022	Data AugmentationLanguage Modeling	CodeCode Available	0
SAGE: Saliency-Guided Mixup with Optimal Rearrangements	Oct 31, 2022	Data AugmentationDomain Generalization	—Unverified	0
Embedding Space Augmentation for Weakly Supervised Learning in Whole-Slide Images	Oct 31, 2022	Data AugmentationGenerative Adversarial Network	—Unverified	0
Counterfactual Data Augmentation via Perspective Transition for Open-Domain Dialogues	Oct 30, 2022	counterfactualCounterfactual Inference	CodeCode Available	0
Speaker Representation Learning via Contrastive Loss with Maximal Speaker Separability	Oct 29, 2022	Contrastive LearningData Augmentation	CodeCode Available	1
Differentiable Data Augmentation for Contrastive Sentence Representation Learning	Oct 29, 2022	Contrastive LearningData Augmentation	CodeCode Available	1
Interpretable CNN-Multilevel Attention Transformer for Rapid Recognition of Pneumonia from Chest X-Ray Images	Oct 29, 2022	Data AugmentationImage Augmentation	—Unverified	0
Diverse Parallel Data Synthesis for Cross-Database Adaptation of Text-to-SQL Parsers	Oct 29, 2022	Data AugmentationNatural Language Queries	—Unverified	0
A Comparative Study of Graph Neural Networks for Shape Classification in Neuroimaging	Oct 29, 2022	ClassificationData Augmentation	CodeCode Available	0
Anomaly Detection in Additive Manufacturing Processes using Supervised Classification with Imbalanced Sensor Data based on Generative Adversarial Network	Oct 28, 2022	Anomaly DetectionData Augmentation	—Unverified	0
RoChBert: Towards Robust BERT Fine-tuning for Chinese	Oct 28, 2022	Data AugmentationLanguage Modeling	CodeCode Available	1
Random Utterance Concatenation Based Data Augmentation for Improving Short-video Speech Recognition	Oct 28, 2022	Action DetectionActivity Detection	—Unverified	0
FUSSL: Fuzzy Uncertain Self Supervised Learning	Oct 28, 2022	Data AugmentationSelf-Supervised Learning	—Unverified	0
Latent Space is Feature Space: Regularization Term for GANs Training on Limited Dataset	Oct 28, 2022	Data AugmentationDiversity	CodeCode Available	0
Rawgment: Noise-Accounted RAW Augmentation Enables Recognition in a Wide Variety of Environments	Oct 28, 2022	Data AugmentationImage Augmentation	—Unverified	0
U-Net-based Models for Skin Lesion Segmentation: More Attention and Augmentation	Oct 28, 2022	Data AugmentationLesion Segmentation	CodeCode Available	1
GraphMAD: Graph Mixup for Data Augmentation using Data-Driven Convex Clustering	Oct 27, 2022	ClusteringData Augmentation	CodeCode Available	0
A Generic Shared Attention Mechanism for Various Backbone Neural Networks	Oct 27, 2022	Data Augmentationimage-classification	—Unverified	0
An Adversarial Active Sampling-based Data Augmentation Framework for Manufacturable Chip Design	Oct 27, 2022	Data Augmentation	—Unverified	0
ScoreMix: A Scalable Augmentation Strategy for Training GANs with Limited Data	Oct 27, 2022	Data AugmentationDiversity	—Unverified	0
A knowledge-driven vowel-based approach of depression classification from speech using data augmentation	Oct 27, 2022	Data AugmentationDecision Making	CodeCode Available	0
FreeVC: Towards High-Quality Text-Free One-Shot Voice Conversion	Oct 27, 2022	Data Augmentationtext annotation	CodeCode Available	2
Make More of Your Data: Minimal Effort Data Augmentation for Automatic Speech Recognition and Translation	Oct 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Towards customizable reinforcement learning agents: Enabling preference specification through online vocabulary expansion	Oct 27, 2022	Data AugmentationMinecraft	—Unverified	0
Bridging the visual gap in VLN via semantically richer instructions	Oct 27, 2022	Data AugmentationNavigate	—Unverified	0
Domain Adaptive Object Detection for Autonomous Driving under Foggy Weather	Oct 27, 2022	Autonomous DrivingData Augmentation	CodeCode Available	1
Dictionary-Assisted Supervised Contrastive Learning	Oct 27, 2022	Contrastive LearningData Augmentation	CodeCode Available	0
Addressing Heterogeneity in Federated Learning via Distributional Transformation	Oct 26, 2022	Data AugmentationFederated Learning	CodeCode Available	0
TuneUp: A Simple Improved Training Strategy for Graph Neural Networks	Oct 26, 2022	Data Augmentation	—Unverified	0
In search of strong embedding extractors for speaker diarisation	Oct 26, 2022	Data AugmentationSpeaker Verification	—Unverified	0
Long-tailed Food Classification	Oct 26, 2022	ClassificationData Augmentation	—Unverified	0
Pretrained audio neural networks for Speech emotion recognition in Portuguese	Oct 26, 2022	Data AugmentationEmotion Recognition	CodeCode Available	0
Automatic Diagnosis of Myocarditis Disease in Cardiac MRI Modality using Deep Transformers and Explainable Artificial Intelligence	Oct 26, 2022	Data AugmentationDenoising	—Unverified	0
Weakly Supervised Data Augmentation Through Prompting for Dialogue Understanding	Oct 25, 2022	Data AugmentationDialogue Understanding	—Unverified	0
Learning to Augment via Implicit Differentiation for Domain Generalization	Oct 25, 2022	Data AugmentationDomain Generalization	—Unverified	0
The Curious Case of Benign Memorization	Oct 25, 2022	Data AugmentationMemorization	—Unverified	0
On Robust Incremental Learning over Many Multilingual Steps	Oct 25, 2022	Data AugmentationIncremental Learning	—Unverified	0
I Prefer not to Say: Protecting User Consent in Models with Optional Personal Data	Oct 25, 2022	Data AugmentationDecision Making	CodeCode Available	0
'A net for everyone': fully personalized and unsupervised neural networks trained with longitudinal data from a single patient	Oct 25, 2022	Data AugmentationGenerative Adversarial Network	—Unverified	0
Multi-Domain Long-Tailed Learning by Augmenting Disentangled Representations	Oct 25, 2022	Data AugmentationDisentanglement	CodeCode Available	0
Efficiently Trained Low-Resource Mongolian Text-to-Speech System Based On FullConv-TTS	Oct 24, 2022	Data AugmentationGPU	—Unverified	0
Provably Learning Diverse Features in Multi-View Data with Midpoint Mixup	Oct 24, 2022	Data Augmentationimage-classification	CodeCode Available	0
Sufficient Invariant Learning for Distribution Shift	Oct 24, 2022	Data Augmentation	—Unverified	0

Show:10 25 50

← PrevPage 76 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified