Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3551–3575 of 8378 papers

Title	Date	Tasks	Status	Hype
Visual Transformers for Primates Classification and Covid Detection	Dec 20, 2022	Audio ClassificationClassification	—Unverified	0
Rumour detection using graph neural network and oversampling in benchmark Twitter dataset	Dec 20, 2022	Data Augmentationfeature selection	—Unverified	0
DISCO: Distilling Counterfactuals with Large Language Models	Dec 20, 2022	counterfactualData Augmentation	CodeCode Available	1
On-the-fly Denoising for Data Augmentation in Natural Language Understanding	Dec 20, 2022	Data AugmentationDenoising	CodeCode Available	0
An Augmentation Strategy for Visually Rich Documents	Dec 20, 2022	Data Augmentation	—Unverified	0
Data Augmentation on Graphs: A Technical Survey	Dec 20, 2022	Data AugmentationGraph Representation Learning	CodeCode Available	1
Discrete Point-wise Attack Is Not Enough: Generalized Manifold Adversarial Attack for Face Recognition	Dec 19, 2022	Adversarial AttackData Augmentation	CodeCode Available	1
SegAugment: Maximizing the Utility of Speech Translation Data with Segmentation-based Augmentations	Dec 19, 2022	Data AugmentationSegmentation	CodeCode Available	0
Predicting Ejection Fraction from Chest X-rays Using Computer Vision for Diagnosing Heart Failure	Dec 19, 2022	Data AugmentationManagement	—Unverified	0
StyleFlow: Disentangle Latent Representations via Normalizing Flow for Unsupervised Text Style Transfer	Dec 19, 2022	Data AugmentationDecoder	—Unverified	0
Randomized Quantization: A Generic Augmentation for Data Agnostic Self-supervised Learning	Dec 19, 2022	Data AugmentationQuantization	CodeCode Available	1
Synthetic Data Augmentation Using GAN For Improved Automated Visual Inspection	Dec 19, 2022	Data AugmentationDefect Detection	—Unverified	0
APOLLO: A Simple Approach for Adaptive Pretraining of Language Models for Logical Reasoning	Dec 19, 2022	Data AugmentationLanguage Modeling	—Unverified	0
Sentence-level Feedback Generation for English Language Learners: Does Data Augmentation Help?	Dec 18, 2022	Comment GenerationData Augmentation	—Unverified	0
PoE: a Panel of Experts for Generalized Automatic Dialogue Assessment	Dec 18, 2022	Data AugmentationDialogue Evaluation	—Unverified	0
Balanced Split: A new train-test data splitting strategy for imbalanced datasets	Dec 17, 2022	Data AugmentationEnsemble Learning	CodeCode Available	0
AugTriever: Unsupervised Dense Retrieval and Domain Adaptation by Scalable Data Augmentation	Dec 17, 2022	Data AugmentationDomain Adaptation	CodeCode Available	0
Human Image Generation: A Comprehensive Survey	Dec 17, 2022	Data AugmentationImage Generation	—Unverified	0
Multi-Scales Data Augmentation Approach In Natural Language Inference For Artifacts Mitigation And Pre-Trained Model Optimization	Dec 16, 2022	Data AugmentationModel Optimization	—Unverified	0
ColorSense: A Study on Color Vision in Machine Visual Recognition	Dec 16, 2022	Data AugmentationObject Recognition	—Unverified	0
Check-worthy Claim Detection across Topics for Automated Fact-checking	Dec 16, 2022	Data AugmentationFact Checking	—Unverified	0
Uniform Sequence Better: Time Interval Aware Data Augmentation for Sequential Recommendation	Dec 16, 2022	Data AugmentationSequential Recommendation	CodeCode Available	1
Better May Not Be Fairer: A Study on Subgroup Discrepancy in Image Classification	Dec 16, 2022	Data Augmentationimage-classification	CodeCode Available	0
Multi-VALUE: A Framework for Cross-Dialectal English NLP	Dec 15, 2022	Data AugmentationMachine Translation	—Unverified	0
The effects of gender bias in word embeddings on depression prediction	Dec 15, 2022	Data AugmentationWord Embeddings	—Unverified	0

Show:10 25 50

← PrevPage 143 of 336Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified