Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3551–3600 of 8378 papers

Title	Date	Tasks	Status	Hype
DISCO: Distilling Counterfactuals with Large Language Models	Dec 20, 2022	counterfactualData Augmentation	CodeCode Available	1
Rumour detection using graph neural network and oversampling in benchmark Twitter dataset	Dec 20, 2022	Data Augmentationfeature selection	—Unverified	0
An Augmentation Strategy for Visually Rich Documents	Dec 20, 2022	Data Augmentation	—Unverified	0
On the Applicability of Synthetic Data for Re-Identification	Dec 20, 2022	Data Augmentation	CodeCode Available	0
On-the-fly Denoising for Data Augmentation in Natural Language Understanding	Dec 20, 2022	Data AugmentationDenoising	CodeCode Available	0
Data Augmentation on Graphs: A Technical Survey	Dec 20, 2022	Data AugmentationGraph Representation Learning	CodeCode Available	1
Discrete Point-wise Attack Is Not Enough: Generalized Manifold Adversarial Attack for Face Recognition	Dec 19, 2022	Adversarial AttackData Augmentation	CodeCode Available	1
SegAugment: Maximizing the Utility of Speech Translation Data with Segmentation-based Augmentations	Dec 19, 2022	Data AugmentationSegmentation	CodeCode Available	0
StyleFlow: Disentangle Latent Representations via Normalizing Flow for Unsupervised Text Style Transfer	Dec 19, 2022	Data AugmentationDecoder	—Unverified	0
Predicting Ejection Fraction from Chest X-rays Using Computer Vision for Diagnosing Heart Failure	Dec 19, 2022	Data AugmentationManagement	—Unverified	0
Randomized Quantization: A Generic Augmentation for Data Agnostic Self-supervised Learning	Dec 19, 2022	Data AugmentationQuantization	CodeCode Available	1
APOLLO: A Simple Approach for Adaptive Pretraining of Language Models for Logical Reasoning	Dec 19, 2022	Data AugmentationLanguage Modeling	—Unverified	0
Synthetic Data Augmentation Using GAN For Improved Automated Visual Inspection	Dec 19, 2022	Data AugmentationDefect Detection	—Unverified	0
Sentence-level Feedback Generation for English Language Learners: Does Data Augmentation Help?	Dec 18, 2022	Comment GenerationData Augmentation	—Unverified	0
PoE: a Panel of Experts for Generalized Automatic Dialogue Assessment	Dec 18, 2022	Data AugmentationDialogue Evaluation	—Unverified	0
Balanced Split: A new train-test data splitting strategy for imbalanced datasets	Dec 17, 2022	Data AugmentationEnsemble Learning	CodeCode Available	0
AugTriever: Unsupervised Dense Retrieval and Domain Adaptation by Scalable Data Augmentation	Dec 17, 2022	Data AugmentationDomain Adaptation	CodeCode Available	0
Human Image Generation: A Comprehensive Survey	Dec 17, 2022	Data AugmentationImage Generation	—Unverified	0
Multi-Scales Data Augmentation Approach In Natural Language Inference For Artifacts Mitigation And Pre-Trained Model Optimization	Dec 16, 2022	Data AugmentationModel Optimization	—Unverified	0
Uniform Sequence Better: Time Interval Aware Data Augmentation for Sequential Recommendation	Dec 16, 2022	Data AugmentationSequential Recommendation	CodeCode Available	1
ColorSense: A Study on Color Vision in Machine Visual Recognition	Dec 16, 2022	Data AugmentationObject Recognition	—Unverified	0
Check-worthy Claim Detection across Topics for Automated Fact-checking	Dec 16, 2022	Data AugmentationFact Checking	—Unverified	0
Better May Not Be Fairer: A Study on Subgroup Discrepancy in Image Classification	Dec 16, 2022	Data Augmentationimage-classification	CodeCode Available	0
The effects of gender bias in word embeddings on depression prediction	Dec 15, 2022	Data AugmentationWord Embeddings	—Unverified	0
Multi-VALUE: A Framework for Cross-Dialectal English NLP	Dec 15, 2022	Data AugmentationMachine Translation	—Unverified	0
SBSS: Stacking-Based Semantic Segmentation Framework for Very High Resolution Remote Sensing Image	Dec 15, 2022	Data AugmentationSegmentation	—Unverified	0
The Effects of Character-Level Data Augmentation on Style-Based Dating of Historical Manuscripts	Dec 15, 2022	Data Augmentation	CodeCode Available	0
Urban Scene Semantic Segmentation with Low-Cost Coarse Annotation	Dec 15, 2022	Data AugmentationDiversity	—Unverified	0
DeepJoin: Joinable Table Discovery with Pre-trained Language Models	Dec 15, 2022	Data AugmentationGPU	—Unverified	0
A Critical Appraisal of Data Augmentation Methods for Imaging-Based Medical Diagnosis Applications	Dec 14, 2022	Data AugmentationMedical Diagnosis	—Unverified	0
Calibration-Free Driver Drowsiness Classification based on Manifold-Level Augmentation	Dec 14, 2022	Brain Computer InterfaceData Augmentation	CodeCode Available	0
Build-a-Bot: Teaching Conversational AI Using a Transformer-Based Intent Recognition and Question Answering Architecture	Dec 14, 2022	AI AgentChatbot	—Unverified	0
Generative Robust Classification	Dec 14, 2022	ClassificationData Augmentation	—Unverified	0
MA-GCL: Model Augmentation Tricks for Graph Contrastive Learning	Dec 14, 2022	Contrastive LearningData Augmentation	CodeCode Available	1
Robust Policy Optimization in Deep Reinforcement Learning	Dec 14, 2022	continuous-controlContinuous Control	CodeCode Available	0
SMSMix: Sense-Maintained Sentence Mixup for Word Sense Disambiguation	Dec 14, 2022	Data AugmentationSentence	—Unverified	0
Population Template-Based Brain Graph Augmentation for Improving One-Shot Learning Classification	Dec 14, 2022	Binary ClassificationClassification	—Unverified	0
A Machine Learning Enhanced Approach for Automated Sunquake Detection in Acoustic Emission Maps	Dec 13, 2022	Contrastive LearningData Augmentation	—Unverified	0
CropCat: Data Augmentation for Smoothing the Feature Distribution of EEG Signals	Dec 13, 2022	Brain Computer InterfaceData Augmentation	—Unverified	0
Improving Depression estimation from facial videos with face alignment, training optimization and scheduling	Dec 13, 2022	Data AugmentationFace Alignment	—Unverified	0
Style-Label-Free: Cross-Speaker Style Transfer by Quantized VAE and Speaker-wise Normalization in Speech Synthesis	Dec 13, 2022	Data AugmentationSpeech Synthesis	—Unverified	0
Zero-Shot Accent Conversion using Pseudo Siamese Disentanglement Network	Dec 12, 2022	Data AugmentationDisentanglement	—Unverified	0
Robust and Explainable Identification of Logical Fallacies in Natural Language Arguments	Dec 12, 2022	Data AugmentationLogical Fallacies	CodeCode Available	1
RPN: A Word Vector Level Data Augmentation Algorithm in Deep Learning for Language Understanding	Dec 12, 2022	CoLAData Augmentation	CodeCode Available	0
On Pre-Training for Visuo-Motor Control: Revisiting a Learning-from-Scratch Baseline	Dec 12, 2022	BenchmarkingData Augmentation	CodeCode Available	1
CACTI: A Framework for Scalable Multi-Task Multi-Scene Visual Imitation Learning	Dec 12, 2022	Data AugmentationImage Generation	CodeCode Available	1
Teaching What You Should Teach: A Data-Based Distillation Method	Dec 11, 2022	Data AugmentationKnowledge Distillation	—Unverified	0
End-to-End Speech Translation of Arabic to English Broadcast News	Dec 11, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Cap2Aug: Caption guided Image to Image data Augmentation	Dec 11, 2022	ClassificationCross-Domain Few-Shot	—Unverified	0
Towards Scale Balanced 6-DoF Grasp Detection in Cluttered Scenes	Dec 10, 2022	Data AugmentationRobotic Grasping	CodeCode Available	1

Show:10 25 50

← PrevPage 72 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified