Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4551–4600 of 8378 papers

Title	Date	Tasks	Status
UnICLAM:Contrastive Representation Learning with Adversarial Masking for Unified and Interpretable Medical Vision Question Answering	Dec 21, 2022	Data AugmentationDecision Making	—Unverified
Not Just Pretty Pictures: Toward Interventional Data Augmentation Using Text-to-Image Generators	Dec 21, 2022	Data AugmentationDomain Generalization	CodeCode Available
Joint Speech Transcription and Translation: Pseudo-Labeling with Out-of-Distribution Data	Dec 20, 2022	Data AugmentationPseudo Label	—Unverified
On the Applicability of Synthetic Data for Re-Identification	Dec 20, 2022	Data Augmentation	CodeCode Available
On-the-fly Denoising for Data Augmentation in Natural Language Understanding	Dec 20, 2022	Data AugmentationDenoising	CodeCode Available
Rumour detection using graph neural network and oversampling in benchmark Twitter dataset	Dec 20, 2022	Data Augmentationfeature selection	—Unverified
VoronoiPatches: Evaluating A New Data Augmentation Method	Dec 20, 2022	Data Augmentation	—Unverified
Emotion Selectable End-to-End Text-based Speech Editing	Dec 20, 2022	Data Augmentation	—Unverified
Original or Translated? On the Use of Parallel Data for Translation Quality Estimation	Dec 20, 2022	Data AugmentationMachine Translation	—Unverified
Visual Transformers for Primates Classification and Covid Detection	Dec 20, 2022	Audio ClassificationClassification	—Unverified
An Augmentation Strategy for Visually Rich Documents	Dec 20, 2022	Data Augmentation	—Unverified
End to End Generative Meta Curriculum Learning For Medical Data Augmentation	Dec 20, 2022	Data AugmentationMeta-Learning	—Unverified
Unified Framework for Histopathology Image Augmentation and Classification via Generative Models	Dec 20, 2022	ClassificationData Augmentation	—Unverified
A Twitter BERT Approach for Offensive Language Detection in Marathi	Dec 20, 2022	Data AugmentationLanguage Identification	—Unverified
Flareon: Stealthy any2any Backdoor Injection via Poisoned Augmentation	Dec 20, 2022	Data Augmentation	CodeCode Available
Synthetic Data Augmentation Using GAN For Improved Automated Visual Inspection	Dec 19, 2022	Data AugmentationDefect Detection	—Unverified
SegAugment: Maximizing the Utility of Speech Translation Data with Segmentation-based Augmentations	Dec 19, 2022	Data AugmentationSegmentation	CodeCode Available
APOLLO: A Simple Approach for Adaptive Pretraining of Language Models for Logical Reasoning	Dec 19, 2022	Data AugmentationLanguage Modeling	—Unverified
StyleFlow: Disentangle Latent Representations via Normalizing Flow for Unsupervised Text Style Transfer	Dec 19, 2022	Data AugmentationDecoder	—Unverified
Predicting Ejection Fraction from Chest X-rays Using Computer Vision for Diagnosing Heart Failure	Dec 19, 2022	Data AugmentationManagement	—Unverified
Sentence-level Feedback Generation for English Language Learners: Does Data Augmentation Help?	Dec 18, 2022	Comment GenerationData Augmentation	—Unverified
PoE: a Panel of Experts for Generalized Automatic Dialogue Assessment	Dec 18, 2022	Data AugmentationDialogue Evaluation	—Unverified
AugTriever: Unsupervised Dense Retrieval and Domain Adaptation by Scalable Data Augmentation	Dec 17, 2022	Data AugmentationDomain Adaptation	CodeCode Available
Human Image Generation: A Comprehensive Survey	Dec 17, 2022	Data AugmentationImage Generation	—Unverified
Balanced Split: A new train-test data splitting strategy for imbalanced datasets	Dec 17, 2022	Data AugmentationEnsemble Learning	CodeCode Available
Better May Not Be Fairer: A Study on Subgroup Discrepancy in Image Classification	Dec 16, 2022	Data Augmentationimage-classification	CodeCode Available
Check-worthy Claim Detection across Topics for Automated Fact-checking	Dec 16, 2022	Data AugmentationFact Checking	—Unverified
Multi-Scales Data Augmentation Approach In Natural Language Inference For Artifacts Mitigation And Pre-Trained Model Optimization	Dec 16, 2022	Data AugmentationModel Optimization	—Unverified
ColorSense: A Study on Color Vision in Machine Visual Recognition	Dec 16, 2022	Data AugmentationObject Recognition	—Unverified
Urban Scene Semantic Segmentation with Low-Cost Coarse Annotation	Dec 15, 2022	Data AugmentationDiversity	—Unverified
The Effects of Character-Level Data Augmentation on Style-Based Dating of Historical Manuscripts	Dec 15, 2022	Data Augmentation	CodeCode Available
SBSS: Stacking-Based Semantic Segmentation Framework for Very High Resolution Remote Sensing Image	Dec 15, 2022	Data AugmentationSegmentation	—Unverified
The effects of gender bias in word embeddings on depression prediction	Dec 15, 2022	Data AugmentationWord Embeddings	—Unverified
DeepJoin: Joinable Table Discovery with Pre-trained Language Models	Dec 15, 2022	Data AugmentationGPU	—Unverified
Multi-VALUE: A Framework for Cross-Dialectal English NLP	Dec 15, 2022	Data AugmentationMachine Translation	—Unverified
A Critical Appraisal of Data Augmentation Methods for Imaging-Based Medical Diagnosis Applications	Dec 14, 2022	Data AugmentationMedical Diagnosis	—Unverified
Generative Robust Classification	Dec 14, 2022	ClassificationData Augmentation	—Unverified
SMSMix: Sense-Maintained Sentence Mixup for Word Sense Disambiguation	Dec 14, 2022	Data AugmentationSentence	—Unverified
Build-a-Bot: Teaching Conversational AI Using a Transformer-Based Intent Recognition and Question Answering Architecture	Dec 14, 2022	AI AgentChatbot	—Unverified
Calibration-Free Driver Drowsiness Classification based on Manifold-Level Augmentation	Dec 14, 2022	Brain Computer InterfaceData Augmentation	CodeCode Available
Population Template-Based Brain Graph Augmentation for Improving One-Shot Learning Classification	Dec 14, 2022	Binary ClassificationClassification	—Unverified
Robust Policy Optimization in Deep Reinforcement Learning	Dec 14, 2022	continuous-controlContinuous Control	CodeCode Available
Improving Depression estimation from facial videos with face alignment, training optimization and scheduling	Dec 13, 2022	Data AugmentationFace Alignment	—Unverified
Style-Label-Free: Cross-Speaker Style Transfer by Quantized VAE and Speaker-wise Normalization in Speech Synthesis	Dec 13, 2022	Data AugmentationSpeech Synthesis	—Unverified
A Machine Learning Enhanced Approach for Automated Sunquake Detection in Acoustic Emission Maps	Dec 13, 2022	Contrastive LearningData Augmentation	—Unverified
CropCat: Data Augmentation for Smoothing the Feature Distribution of EEG Signals	Dec 13, 2022	Brain Computer InterfaceData Augmentation	—Unverified
Zero-Shot Accent Conversion using Pseudo Siamese Disentanglement Network	Dec 12, 2022	Data AugmentationDisentanglement	—Unverified
RPN: A Word Vector Level Data Augmentation Algorithm in Deep Learning for Language Understanding	Dec 12, 2022	CoLAData Augmentation	CodeCode Available
Cap2Aug: Caption guided Image to Image data Augmentation	Dec 11, 2022	ClassificationCross-Domain Few-Shot	—Unverified
Teaching What You Should Teach: A Data-Based Distillation Method	Dec 11, 2022	Data AugmentationKnowledge Distillation	—Unverified

Show:10 25 50

← PrevPage 92 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified