Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5801–5850 of 8378 papers

Title	Date	Tasks	Status	Hype
Data augmentation to improve robustness of image captioning solutions	Jun 10, 2021	Data AugmentationImage Captioning	—Unverified	0
Tensor feature hallucination for few-shot learning	Jun 9, 2021	Data AugmentationFew-Shot Learning	CodeCode Available	0
Neighborhood Contrastive Learning Applied to Online Patient Monitoring	Jun 9, 2021	BIG-bench Machine LearningContrastive Learning	CodeCode Available	1
Grounding inductive biases in natural images:invariance stems from variations in data	Jun 9, 2021	Data AugmentationTranslation	CodeCode Available	1
A Comparative Study on Neural Architectures and Training Methods for Japanese Speech Recognition	Jun 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Offline Inverse Reinforcement Learning	Jun 9, 2021	Data AugmentationImitation Learning	—Unverified	0
AUGVIC: Exploiting BiText Vicinity for Low-Resource NMT	Jun 9, 2021	Data AugmentationLow Resource NMT	—Unverified	0
A multi-stage GAN for multi-organ chest X-ray image generation and segmentation	Jun 9, 2021	Data AugmentationImage Generation	—Unverified	0
Joint System-Wise Optimization for Pipeline Goal-Oriented Dialog System	Jun 9, 2021	Data AugmentationGoal-Oriented Dialog	—Unverified	0
It Takes Two to Tango: Mixup for Deep Metric Learning	Jun 9, 2021	Data AugmentationMetric Learning	CodeCode Available	1
Theoretically Motivated Data Augmentation and Regularization for Portfolio Construction	Jun 8, 2021	Data AugmentationDeep Learning	CodeCode Available	0
Self-Supervised Learning with Data Augmentations Provably Isolates Content from Style	Jun 8, 2021	Data AugmentationDisentanglement	CodeCode Available	1
Disfl-QA: A Benchmark Dataset for Understanding Disfluencies in Question Answering	Jun 8, 2021	Data AugmentationQuestion Answering	CodeCode Available	1
Data-Efficient Instance Generation from Instance Discrimination	Jun 8, 2021	2kData Augmentation	CodeCode Available	1
RobustNav: Towards Benchmarking Robustness in Embodied Navigation	Jun 8, 2021	BenchmarkingData Augmentation	CodeCode Available	1
Generative adversarial network with object detector discriminator for enhanced defect detection on ultrasonic B-scans	Jun 8, 2021	Data AugmentationDefect Detection	—Unverified	0
Cheap and Good? Simple and Effective Data Augmentation for Low Resource Machine Reading	Jun 8, 2021	Data AugmentationMachine Reading Comprehension	CodeCode Available	0
EventDrop: data augmentation for event-based learning	Jun 7, 2021	Data AugmentationDiversity	CodeCode Available	0
Rotating spiders and reflecting dogs: a class conditional approach to learning data augmentation distributions	Jun 7, 2021	Data Augmentation	—Unverified	0
Exploiting Language Relatedness for Low Web-Resource Language Model Adaptation: An Indic Languages Study	Jun 7, 2021	Data AugmentationLanguage Modeling	CodeCode Available	0
RegMix: Data Mixing Augmentation for Regression	Jun 7, 2021	ClassificationData Augmentation	—Unverified	0
Data Augmentation Methods for End-to-end Speech Recognition on Distant-Talk Scenarios	Jun 7, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
On the Language Coverage Bias for Neural Machine Translation	Jun 7, 2021	Data AugmentationMachine Translation	—Unverified	0
CAiRE in DialDoc21: Data Augmentation for Information-Seeking Dialogue System	Jun 7, 2021	Data AugmentationResponse Generation	CodeCode Available	1
Go with the Flows: Mixtures of Normalizing Flows for Point Cloud Generation and Reconstruction	Jun 6, 2021	Data AugmentationPoint Cloud Generation	—Unverified	0
Feature-based Style Randomization for Domain Generalization	Jun 6, 2021	Data AugmentationDiversity	—Unverified	0
Training Robust Graph Neural Networks with Topology Adaptive Edge Dropping	Jun 5, 2021	Data Augmentation	—Unverified	0
AOSLO-net: A deep learning-based method for automatic segmentation of retinal microaneurysms from adaptive optics scanning laser ophthalmoscope images	Jun 5, 2021	Data AugmentationTransfer Learning	—Unverified	0
Cross-language Sentence Selection via Data Augmentation and Rationale Training	Jun 4, 2021	Data AugmentationMachine Translation	—Unverified	0
Bi-Granularity Contrastive Learning for Post-Training in Few-Shot Scene	Jun 4, 2021	Contrastive LearningData Augmentation	—Unverified	0
Self-Guided Contrastive Learning for BERT Sentence Representations	Jun 3, 2021	Contrastive LearningData Augmentation	CodeCode Available	1
Speaker verification-derived loss and data augmentation for DNN-based multispeaker speech synthesis	Jun 3, 2021	Data AugmentationSpeaker Verification	—Unverified	0
Learning from Counterfactual Links for Link Prediction	Jun 3, 2021	Causal Inferencecounterfactual	CodeCode Available	1
Finding and Fixing Spurious Patterns with Explanations	Jun 3, 2021	Data Augmentation	—Unverified	0
LearnDA: Learnable Knowledge-Guided Data Augmentation for Event Causality Identification	Jun 3, 2021	Data AugmentationEvent Causality Identification	—Unverified	0
Bayesian Inference for Gamma Models	Jun 3, 2021	Bayesian InferenceData Augmentation	—Unverified	0
Can vectors read minds better than experts? Comparing data augmentation strategies for the automated scoring of children's mindreading ability	Jun 3, 2021	Data Augmentation	—Unverified	0
Pathology-Aware Generative Adversarial Networks for Medical Image Augmentation	Jun 3, 2021	Data AugmentationImage Augmentation	—Unverified	0
Semantic Palette: Guiding Scene Generation with Class Proportions	Jun 3, 2021	Data AugmentationImage Generation	CodeCode Available	1
Noisy student-teacher training for robust keyword spotting	Jun 3, 2021	Data AugmentationKeyword Spotting	—Unverified	0
Long Term Object Detection and Tracking in Collaborative Learning Environments	Jun 2, 2021	Activity RecognitionActivity Recognition In Videos	—Unverified	0
SemiFL: Semi-Supervised Federated Learning for Unlabeled Clients with Alternate Training	Jun 2, 2021	Data AugmentationFederated Learning	CodeCode Available	1
Data augmentation and pre-trained networks for extremely low data regimes unsupervised visual inspection	Jun 2, 2021	Anomaly DetectionData Augmentation	—Unverified	0
Knowing More About Questions Can Help: Improving Calibration in Question Answering	Jun 2, 2021	Answer GenerationData Augmentation	CodeCode Available	1
Benchmarking CNN on 3D Anatomical Brain MRI: Architectures, Data Augmentation and Deep Ensemble Learning	Jun 2, 2021	BenchmarkingData Augmentation	—Unverified	0
Rotom: A Meta-Learned Data Augmentation Framework for Entity Matching, Data Cleaning, Text Classification, and Beyond	Jun 1, 2021	Data AugmentationEntity Resolution	CodeCode Available	1
Automatic Classification of Attributes in German Adjective-Noun Phrases	Jun 1, 2021	AttributeClassification	CodeCode Available	0
TopGuNN: Fast NLP Training Data Augmentation using Large Corpora	Jun 1, 2021	Data AugmentationRetrieval	CodeCode Available	0
IIITN NLP at SMM4H 2021 Tasks: Transformer Models for Classification on Health-Related Imbalanced Twitter Datasets	Jun 1, 2021	Binary ClassificationData Augmentation	—Unverified	0
Joint Summarization-Entailment Optimization for Consumer Health Question Understanding	Jun 1, 2021	Data Augmentation	CodeCode Available	1

Show:10 25 50

← PrevPage 117 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified