Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5201–5250 of 8378 papers

Title	Date	Tasks	Status
YOLOv5s-GTB: light-weighted and improved YOLOv5s for bridge crack detection	Jun 3, 2022	Data AugmentationImage Classification	—Unverified
Integrating Prior Knowledge in Contrastive Learning with Kernel	Jun 3, 2022	Contrastive LearningData Augmentation	CodeCode Available
Long-tailed Recognition by Learning from Latent Categories	Jun 2, 2022	Data AugmentationDiversity	—Unverified
eRock at Qur’an QA 2022: Contemporary Deep Neural Networks for Qur’an based Reading Comprehension Question Answers	Jun 1, 2022	Data AugmentationQuestion Answering	—Unverified
Exploring Text Recombination for Automatic Narrative Level Detection	Jun 1, 2022	Data AugmentationNatural Language Understanding	—Unverified
Order-sensitive Shapley Values for Evaluating Conceptual Soundness of NLP Models	Jun 1, 2022	Data AugmentationNegation	—Unverified
Exploring Data Augmentation Strategies for Hate Speech Detection in Roman Urdu	Jun 1, 2022	Data AugmentationHate Speech Detection	—Unverified
Mitigating Dataset Artifacts in Natural Language Inference Through Automatic Contextual Data Augmentation and Learning Optimization	Jun 1, 2022	Contrastive LearningData Augmentation	—Unverified
Automatic Gloss-level Data Augmentation for Sign Language Translation	Jun 1, 2022	Data AugmentationSentence	—Unverified
Speech Data Augmentation for Improving Phoneme Transcriptions of Aphasic Speech Using Wav2Vec 2.0 for the PSST Challenge	Jun 1, 2022	Automatic Phoneme RecognitionData Augmentation	—Unverified
Fine-tuning of Convolutional Neural Networks for the Recognition of Facial Expressions in Sign Language Video Samples	Jun 1, 2022	Data AugmentationFacial Expression Recognition	—Unverified
Efficient Scheduling of Data Augmentation for Deep Reinforcement Learning	Jun 1, 2022	Data AugmentationDeep Reinforcement Learning	—Unverified
Glyph Features Matter: A Multimodal Solution for EvaHan in LT4HALA2022	Jun 1, 2022	Data AugmentationPart-Of-Speech Tagging	—Unverified
Rethinking the Augmentation Module in Contrastive Learning: Learning Hierarchical Augmentation Invariance with Expanded Views	Jun 1, 2022	Contrastive LearningData Augmentation	CodeCode Available
An Inflectional Database for Gitksan	Jun 1, 2022	Data AugmentationHallucination	CodeCode Available
Data Augmentation for Low-resource Word Segmentation and POS Tagging of Ancient Chinese Texts	Jun 1, 2022	Data AugmentationLanguage Modeling	—Unverified
LuxemBERT: Simple and Practical Data Augmentation in Language Model Pre-Training for Luxembourgish	Jun 1, 2022	Data AugmentationLanguage Modeling	—Unverified
Examining the Effects of Language-and-Vision Data Augmentation for Generation of Descriptions of Human Faces	Jun 1, 2022	Caption GenerationData Augmentation	—Unverified
Towards Generalisable Audio Representations for Audio-Visual Navigation	Jun 1, 2022	Contrastive LearningData Augmentation	—Unverified
Data Expansion Using WordNet-based Semantic Expansion and Word Disambiguation for Cyberbullying Detection	Jun 1, 2022	Binary ClassificationData Augmentation	—Unverified
Data Augmentation for the Post-Stroke Speech Transcription (PSST) Challenge: Sometimes Less Is More	Jun 1, 2022	Data AugmentationLanguage Modeling	—Unverified
Effectiveness of Data Augmentation and Pretraining for Improving Neural Headline Generation in Low-Resource Settings	Jun 1, 2022	Data AugmentationDecoder	—Unverified
Ancient Chinese Word Segmentation and Part-of-Speech Tagging Using Data Augmentation	Jun 1, 2022	Chinese Word SegmentationData Augmentation	—Unverified
A First Attempt at Unreliable News Detection in Swedish	Jun 1, 2022	ArticlesData Augmentation	—Unverified
Scaling up Discourse Quality Annotation for Political Science	Jun 1, 2022	Argument MiningData Augmentation	CodeCode Available
Self-supervised Learning for Label Sparsity in Computational Drug Repositioning	Jun 1, 2022	Data AugmentationDrug Discovery	—Unverified
Point-Teaching: Weakly Semi-Supervised Object Detection with Point Annotations	Jun 1, 2022	Data AugmentationMultiple Instance Learning	—Unverified
Tackling Irony Detection using Ensemble Classifiers	Jun 1, 2022	Binary ClassificationData Augmentation	CodeCode Available
A Multi-level Supervised Contrastive Learning Framework for Low-Resource Natural Language Inference	May 31, 2022	Contrastive LearningData Augmentation	—Unverified
Augmentation-Aware Self-Supervision for Data-Efficient GAN Training	May 31, 2022	Data AugmentationRepresentation Learning	CodeCode Available
A Kernelised Stein Statistic for Assessing Implicit Generative Models	May 31, 2022	Data AugmentationSynthetic Data Generation	CodeCode Available
Your Contrastive Learning Is Secretly Doing Stochastic Neighbor Embedding	May 30, 2022	Contrastive LearningData Augmentation	CodeCode Available
Duplex Conversation: Towards Human-like Interaction in Spoken Dialogue Systems	May 30, 2022	Data AugmentationSpoken Dialogue Systems	—Unverified
Segmentation Consistency Training: Out-of-Distribution Generalization for Medical Image Segmentation	May 30, 2022	Data AugmentationImage Segmentation	CodeCode Available
Adversarial synthesis based data-augmentation for code-switched spoken language identification	May 30, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Graph Structure Based Data Augmentation Method	May 29, 2022	Data AugmentationEEG	—Unverified
A General Multiple Data Augmentation Based Framework for Training Deep Neural Networks	May 29, 2022	Data Augmentationimage-classification	—Unverified
Saliency Map Based Data Augmentation	May 29, 2022	ClassificationData Augmentation	—Unverified
MDMLP: Image Classification from Scratch on Small Datasets with MLP	May 28, 2022	Data Augmentationimage-classification	CodeCode Available
Who is we? Disambiguating the referents of first person plural pronouns in parliamentary debates	May 27, 2022	Data Augmentation	—Unverified
How Tempering Fixes Data Augmentation in Bayesian Neural Networks	May 27, 2022	Data Augmentation	—Unverified
Leveraging Causal Inference for Explainable Automatic Program Repair	May 26, 2022	Bug fixingCausal Inference	—Unverified
Triangular Contrastive Learning on Molecular Graphs	May 26, 2022	Contrastive LearningData Augmentation	—Unverified
Audio Data Augmentation for Acoustic-to-articulatory Speech Inversion using Bidirectional Gated RNNs	May 25, 2022	Data Augmentation	—Unverified
Counterfactual Data Augmentation improves Factuality of Abstractive Summarization	May 25, 2022	Abstractive Text Summarizationcounterfactual	—Unverified
An Empirical Study on Distribution Shift Robustness From the Perspective of Pre-Training and Data Augmentation	May 25, 2022	Data Augmentation	—Unverified
Leveraging QA Datasets to Improve Generative Data Augmentation	May 25, 2022	Common Sense ReasoningData Augmentation	CodeCode Available
Conditional set generation using Seq2seq models	May 25, 2022	Data AugmentationEntity Typing	—Unverified
Augmentation-induced Consistency Regularization for Classification	May 25, 2022	Audio ClassificationClassification	—Unverified
Does Your Model Classify Entities Reasonably? Diagnosing and Mitigating Spurious Correlations in Entity Typing	May 25, 2022	counterfactualData Augmentation	CodeCode Available

Show:10 25 50

← PrevPage 105 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified