Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6001–6050 of 8378 papers

Title	Date	Tasks	Status	Hype
Track, Check, Repeat: An EM Approach to Unsupervised Tracking	Apr 7, 2021	Data AugmentationObject Discovery	—Unverified	0
Correlation Sketches for Approximate Join-Correlation Queries	Apr 7, 2021	Data Augmentation	—Unverified	0
Regularizing Generative Adversarial Networks under Limited Data	Apr 7, 2021	Data AugmentationImage Generation	CodeCode Available	1
Bootstrapping Your Own Positive Sample: Contrastive Learning With Electronic Health Record Data	Apr 7, 2021	AttributeContrastive Learning	—Unverified	0
Incremental Generative Occlusion Adversarial Suppression Network for Person ReID	Apr 6, 2021	Data AugmentationPerson Re-Identification	CodeCode Available	1
Achieving Domain Generalization in Underwater Object Detection by Domain Mixup and Contrastive Learning	Apr 6, 2021	Contrastive LearningData Augmentation	—Unverified	0
Generalization of GANs and overparameterized models under Lipschitz continuity	Apr 6, 2021	Data AugmentationGeneralization Bounds	—Unverified	0
Weakly supervised segmentation with cross-modality equivariant constraints	Apr 6, 2021	Data AugmentationSemantic Segmentation	CodeCode Available	1
Personalized Speech Enhancement through Self-Supervised Data Augmentation and Purification	Apr 5, 2021	Data AugmentationDenoising	—Unverified	0
An Empirical Study on Channel Effects for Synthetic Voice Spoofing Countermeasure Systems	Apr 3, 2021	Data AugmentationMulti-Task Learning	CodeCode Available	1
Intent Recognition and Unsupervised Slot Identification for Low Resourced Spoken Dialog Systems	Apr 3, 2021	Data AugmentationGeneral Classification	—Unverified	0
Topological Regularization for Graph Neural Networks Augmentation	Apr 3, 2021	Data AugmentationGraph Neural Network	—Unverified	0
On-the-Fly Aligned Data Augmentation for Sequence-to-Sequence ASR	Apr 3, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
MR-Contrast-Aware Image-to-Image Translations with Generative Adversarial Networks	Apr 3, 2021	Data AugmentationGenerative Adversarial Network	—Unverified	0
Neural Network Robustness as a Verification Property: A Principled Case Study	Apr 3, 2021	Data Augmentation	CodeCode Available	0
On the Pitfalls of Learning with Limited Data: A Facial Expression Recognition Case Study	Apr 2, 2021	Data AugmentationDeep Learning	—Unverified	0
Diverse Gaussian Noise Consistency Regularization for Robustness and Uncertainty Calibration	Apr 2, 2021	Data AugmentationImage Classification	CodeCode Available	0
Data Augmentation with Manifold Barycenters	Apr 2, 2021	Data Augmentation	—Unverified	0
Plot2API: Recommending Graphic API from Plot via Semantic Parsing Guided Neural Network	Apr 2, 2021	Data AugmentationData Visualization	CodeCode Available	0
Multi-class motion-based semantic segmentation for ureteroscopy and laser lithotripsy	Apr 2, 2021	Data AugmentationSegmentation	—Unverified	0
A Case Study of Efficacy and Challenges in Practical Human-in-Loop Evaluation of NLP Systems Using Checklist	Apr 1, 2021	Data Augmentation	—Unverified	0
Sarcasm and Sentiment Detection In Arabic Tweets Using BERT-based Models and Data Augmentation	Apr 1, 2021	Data AugmentationSarcasm Detection	—Unverified	0
A Contextual Word Embedding for Arabic Sarcasm Detection with Random Forests	Apr 1, 2021	Data AugmentationSarcasm Detection	—Unverified	0
GABO: Graph Augmentations with Bi-level Optimization	Apr 1, 2021	Bilevel OptimizationData Augmentation	—Unverified	0
EfficientNetV2: Smaller Models and Faster Training	Apr 1, 2021	AutoMLClassification	CodeCode Available	3
Few-shot learning through contextual data augmentation	Mar 31, 2021	Data AugmentationFew-Shot Learning	CodeCode Available	0
SpecAugment++: A Hidden Space Data Augmentation Method for Acoustic Scene Classification	Mar 31, 2021	Acoustic Scene ClassificationData Augmentation	—Unverified	0
Scale-aware Automatic Augmentation for Object Detection	Mar 31, 2021	Data AugmentationInstance Segmentation	CodeCode Available	1
ReMix: Towards Image-to-Image Translation with Limited Data	Mar 31, 2021	Data AugmentationImage-to-Image Translation	CodeCode Available	1
Rainbow Memory: Continual Learning with a Memory of Diverse Samples	Mar 31, 2021	Continual LearningData Augmentation	CodeCode Available	1
An Exploration of Data Augmentation Techniques for Improving English to Tigrinya Translation	Mar 31, 2021	Data AugmentationMachine Translation	—Unverified	0
Data augmentation for dealing with low sampling rates in NILM	Mar 30, 2021	Data Augmentation	—Unverified	0
Large Scale Autonomous Driving Scenarios Clustering with Self-supervised Feature Extraction	Mar 30, 2021	Autonomous DrivingClustering	—Unverified	0
Improving robustness against common corruptions with frequency biased models	Mar 30, 2021	Data Augmentationobject-detection	—Unverified	0
Unsupervised Disentanglement of Linear-Encoded Facial Semantics	Mar 30, 2021	Data AugmentationDisentanglement	—Unverified	0
Enabling Data Diversity: Efficient Automatic Augmentation via Regularized Adversarial Training	Mar 30, 2021	Cancer ClassificationData Augmentation	CodeCode Available	0
Learning Representational Invariances for Data-Efficient Action Recognition	Mar 30, 2021	Action RecognitionData Augmentation	CodeCode Available	1
Learning Domain Invariant Representations for Generalizable Person Re-Identification	Mar 29, 2021	Data AugmentationDomain Generalization	—Unverified	0
Data Augmentation in a Hybrid Approach for Aspect-Based Sentiment Analysis	Mar 29, 2021	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available	0
Improved Meta-Learning Training for Speaker Verification	Mar 29, 2021	Data AugmentationMeta-Learning	—Unverified	0
Contextual Scene Augmentation and Synthesis via GSACNet	Mar 29, 2021	Data AugmentationGraph Attention	—Unverified	0
AlignMixup: Improving Representations By Interpolating Aligned Features	Mar 29, 2021	Data AugmentationRepresentation Learning	CodeCode Available	1
Noise Injection-based Regularization for Point Cloud Processing	Mar 28, 2021	Data AugmentationSemantic Segmentation	—Unverified	0
Representation Learning by Ranking under multiple tasks	Mar 28, 2021	Data AugmentationMulti-Label Learning	—Unverified	0
Improving prostate whole gland segmentation in t2-weighted MRI with synthetically generated data	Mar 27, 2021	Data AugmentationSegmentation	—Unverified	0
Self-supervised Graph Neural Networks without explicit negative sampling	Mar 27, 2021	Contrastive LearningData Augmentation	CodeCode Available	1
Unsupervised Document Embedding via Contrastive Augmentation	Mar 26, 2021	Contrastive LearningData Augmentation	—Unverified	0
DivAug: Plug-in Automated Data Augmentation with Explicit Diversity Maximization	Mar 26, 2021	Data AugmentationDiversity	CodeCode Available	1
Data Augmentation in Natural Language Processing: A Novel Text Generation Approach for Long and Short Text Classifiers	Mar 26, 2021	Data AugmentationText Generation	—Unverified	0
An Approach to Improve Robustness of NLP Systems against ASR Errors	Mar 25, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0

Show:10 25 50

← PrevPage 121 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified