Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5301–5350 of 8378 papers

Title	Date	Tasks	Status
Few-shot Mining of Naturally Occurring Inputs and Outputs	May 9, 2022	Abstractive Text SummarizationData Augmentation	—Unverified
Improving negation detection with negation-focused pre-training	May 9, 2022	Data AugmentationDiversity	—Unverified
How Does Frequency Bias Affect the Robustness of Neural Image Classifiers against Common Corruption and Adversarial Perturbations?	May 9, 2022	Data Augmentation	—Unverified
Alternative Data Augmentation for Industrial Monitoring using Adversarial Learning	May 9, 2022	Data AugmentationImage-to-Image Translation	—Unverified
MixAugment & Mixup: Augmentation Methods for Facial Expression Recognition	May 9, 2022	Data AugmentationFacial Expression Recognition	—Unverified
Data Augmentation with Paraphrase Generation and Entity Extraction for Multimodal Dialogue System	May 9, 2022	Data AugmentationIntent Recognition	—Unverified
SAN-Net: Learning Generalization to Unseen Sites for Stroke Lesion Segmentation with Self-Adaptive Normalization	May 9, 2022	Data AugmentationLesion Segmentation	CodeCode Available
High-Resolution UAV Image Generation for Sorghum Panicle Detection	May 8, 2022	Data AugmentationImage Generation	—Unverified
A Data Cartography based MixUp for Pre-trained Language Models	May 6, 2022	Data AugmentationLanguage Modeling	CodeCode Available
Text Detection on Technical Drawings for the Digitization of Brown-field Processes	May 5, 2022	Data Augmentationobject-detection	—Unverified
Building Brains: Subvolume Recombination for Data Augmentation in Large Vessel Occlusion Detection	May 5, 2022	Data Augmentation	—Unverified
Neural Rendering in a Room: Amodal 3D Understanding and Free-Viewpoint Rendering for the Closed Scene Composed of Pre-Captured Objects	May 5, 2022	Data AugmentationNeural Rendering	—Unverified
M2R2: Missing-Modality Robust emotion Recognition framework with iterative data augmentation	May 5, 2022	Data AugmentationEmotion Recognition	—Unverified
GAN Inversion for Data Augmentation to Improve Colonoscopy Lesion Classification	May 4, 2022	ClassificationData Augmentation	—Unverified
Analysing the Robustness of Dual Encoders for Dense Retrieval Against Misspellings	May 4, 2022	Contrastive LearningData Augmentation	CodeCode Available
Embedding Hallucination for Few-Shot Language Fine-tuning	May 3, 2022	Data AugmentationHallucination	CodeCode Available
Assessing Dataset Bias in Computer Vision	May 3, 2022	AttributeData Augmentation	—Unverified
SUBS: Subtree Substitution for Compositional Semantic Parsing	May 3, 2022	Data AugmentationSemantic Parsing	CodeCode Available
Effect of Random Histogram Equalization on Breast Calcification Analysis Using Deep Learning	May 3, 2022	Data AugmentationManagement	—Unverified
Assessing unconstrained surgical cuttings in VR using CNNs	May 2, 2022	Data Augmentation	—Unverified
Positive-Unlabeled Learning with Adversarial Data Augmentation for Knowledge Graph Completion	May 2, 2022	Data AugmentationKnowledge Graph Completion	—Unverified
FastGCL: Fast Self-Supervised Learning on Graphs via Contrastive Neighborhood Aggregation	May 2, 2022	ClassificationContrastive Learning	—Unverified
Improving Machine Translation Formality Control with Weakly-Labelled Data Augmentation and Post Editing Strategies	May 1, 2022	Data AugmentationMachine Translation	—Unverified
BpHigh@TamilNLP-ACL2022: Effects of Data Augmentation on Indic-Transformer based classifier for Abusive Comments Detection in Tamil	May 1, 2022	Abusive LanguageData Augmentation	CodeCode Available
Continuing Pre-trained Model with Multiple Training Strategies for Emotional Classification	May 1, 2022	AttributeClassification	—Unverified
Retrieval Data Augmentation Informed by Downstream Question Answering Performance	May 1, 2022	Data AugmentationQuestion Answering	—Unverified
Traffic Context Aware Data Augmentation for Rare Object Detection in Autonomous Driving	May 1, 2022	4kAutonomous Driving	—Unverified
Learning with Limited Text Data	May 1, 2022	Data AugmentationStructured Prediction	—Unverified
FilipN@LT-EDI-ACL2022-Detecting signs of Depression from Social Media: Examining the use of summarization methods as data augmentation for text classification	May 1, 2022	Abstractive Text SummarizationClassification	CodeCode Available
Improving Chinese Grammatical Error Detection via Data augmentation by Conditional Error Generation	May 1, 2022	Data AugmentationGrammatical Error Detection	—Unverified
Decoding Part-of-Speech from Human EEG Signals	May 1, 2022	Data AugmentationEEG	—Unverified
A Simple Approach to Improve Single-Model Deep Uncertainty via Distance-Awareness	May 1, 2022	Data AugmentationDeep Learning	—Unverified
Disambiguation of morpho-syntactic features of African American English – the case of habitual be	May 1, 2022	Data Augmentation	—Unverified
One Wug, Two Wug+s Transformer Inflection Models Hallucinate Affixes	May 1, 2022	Data AugmentationHallucination	—Unverified
A Comparison of Strategies for Source-Free Domain Adaptation	May 1, 2022	Active LearningData Augmentation	CodeCode Available
Resnet18 Model With Sequential Layer For Computing Accuracy On Image Classification Dataset	May 1, 2022	ClassificationData Augmentation	—Unverified
Product Answer Generation from Heterogeneous Sources: A New Benchmark and Best Practices	May 1, 2022	Answer GenerationData Augmentation	—Unverified
DMix: Adaptive Distance-aware Interpolative Mixup	May 1, 2022	Data AugmentationDiversity	CodeCode Available
Nozza@LT-EDI-ACL2022: Ensemble Modeling for Homophobia and Transphobia Detection	May 1, 2022	Data AugmentationPosition	—Unverified
Towards Better Characterization of Paraphrases	May 1, 2022	Data AugmentationMRPC	CodeCode Available
DD-TIG at Constraint@ACL2022: Multimodal Understanding and Reasoning for Role Labeling of Entities in Hateful Memes	May 1, 2022	Continual PretrainingData Augmentation	—Unverified
AugStatic - A Light-Weight Image Augmentation Library	May 1, 2022	ClassificationData Augmentation	CodeCode Available
On the Impact of Data Augmentation on Downstream Performance in Natural Language Processing	May 1, 2022	BIG-bench Machine LearningData Augmentation	—Unverified
Horses to Zebras: Ontology-Guided Data Augmentation and Synthesis for ICD-9 Coding	May 1, 2022	Data Augmentation	—Unverified
Clozer”:" Adaptable Data Augmentation for Cloze-style Reading Comprehension	May 1, 2022	Data AugmentationMachine Reading Comprehension	—Unverified
The YiTrans Speech Translation System for IWSLT 2022 Offline Shared Task	May 1, 2022	Data AugmentationDecoder	—Unverified
The Xiaomi Text-to-Text Simultaneous Speech Translation System for IWSLT 2022	May 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Augmented Balanced Image Dataset Generator Using AugStatic Library	May 1, 2022	ClassificationData Augmentation	CodeCode Available
Data Augmentation for Rare Symptoms in Vaccine Side-Effect Detection	May 1, 2022	Data Augmentation	—Unverified
Seq2Path: Generating Sentiment Tuples as Paths of a Tree	May 1, 2022	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	—Unverified

Show:10 25 50

← PrevPage 107 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified