Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6051–6100 of 8378 papers

Title	Date	Tasks	Status
Robust Mitosis Detection Using a Cascade Mask-RCNN Approach With Domain-Specific Residual Cycle-GAN Data Augmentation	Sep 4, 2021	Data AugmentationMitosis Detection	—Unverified
Self-Supervised Detection of Contextual Synonyms in a Multi-Class Setting: Phenotype Annotation Use Case	Sep 4, 2021	Data AugmentationWord Embeddings	—Unverified
Learning from Multiple Noisy Augmented Data Sets for Better Cross-Lingual Spoken Language Understanding	Sep 3, 2021	Data AugmentationDenoising	—Unverified
Rotation Invariance and Extensive Data Augmentation: a strategy for the Mitosis Domain Generalization (MIDOG) Challenge	Sep 2, 2021	Data AugmentationDomain Generalization	—Unverified
MitoDet: Simple and robust mitosis detection	Sep 2, 2021	Data AugmentationDomain Generalization	—Unverified
Generative Models for Multi-Illumination Color Constancy	Sep 2, 2021	Color ConstancyData Augmentation	—Unverified
Precog-LTRC-IIITH at GermEval 2021: Ensembling Pre-Trained Language Models with Feature Engineering	Sep 1, 2021	Data AugmentationFeature Engineering	CodeCode Available
Application of Deep Learning Methods to SNOMED CT Encoding of Clinical Texts: From Data Collection to Extreme Multi-Label Text-Based Classification	Sep 1, 2021	ClassificationData Augmentation	—Unverified
DFKI SLT at GermEval 2021: Multilingual Pre-training and Data Augmentation for the Classification of Toxicity in Social Media Comments	Sep 1, 2021	Data Augmentation	CodeCode Available
Domain Adaptive Cascade R-CNN for MItosis DOmain Generalization (MIDOG) Challenge	Sep 1, 2021	Data AugmentationDomain Generalization	—Unverified
Application of Mix-Up Method in Document Classification Task Using BERT	Sep 1, 2021	ClassificationData Augmentation	—Unverified
Solving SCAN Tasks with Data Augmentation and Input Embeddings	Sep 1, 2021	Data Augmentation	CodeCode Available
Detecting Mitosis against Domain Shift using a Fused Detector and Deep Ensemble Classification Model for MIDOG Challenge	Aug 31, 2021	Data AugmentationPrognosis	—Unverified
Maximum F1-score training for end-to-end mispronunciation detection and diagnosis of L2 English speech	Aug 31, 2021	Data Augmentation	—Unverified
Using convolutional neural networks for the classification of breast cancer images	Aug 31, 2021	Data AugmentationTransfer Learning	CodeCode Available
Cross-Lingual Text Classification of Transliterated Hindi and Malayalam	Aug 31, 2021	BenchmarkingClassification	CodeCode Available
InSE-NET: A Perceptually Coded Audio Quality Model based on CNN	Aug 30, 2021	Audio Quality AssessmentData Augmentation	—Unverified
3DStyleNet: Creating 3D Shapes with Geometric and Texture Style Variations	Aug 30, 2021	3D ReconstructionData Augmentation	—Unverified
Open Set RF Fingerprinting using Generative Outlier Augmentation	Aug 30, 2021	ClassificationData Augmentation	—Unverified
Europarl-ASR: A Large Corpus of Parliamentary Debates for Streaming ASR Benchmarking and Speech Data Filtering/Verbatimization	Aug 30, 2021	BenchmarkingData Augmentation	—Unverified
ASR-GLUE: A New Multi-task Benchmark for ASR-Robust Natural Language Understanding	Aug 30, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
High performing ensemble of convolutional neural networks for insect pest image detection	Aug 28, 2021	Data Augmentation	—Unverified
ChessMix: Spatial Context Data Augmentation for Remote Sensing Semantic Segmentation	Aug 26, 2021	Data Augmentationimage-classification	CodeCode Available
Data Augmentation for Low-Resource Named Entity Recognition Using Backtranslation	Aug 26, 2021	Data AugmentationLow Resource Named Entity Recognition	CodeCode Available
Similar Scenes arouse Similar Emotions: Parallel Data Augmentation for Stylized Image Captioning	Aug 26, 2021	Data AugmentationImage Captioning	—Unverified
StyleAugment: Learning Texture De-biased Representations by Style Augmentation without Pre-defined Textures	Aug 24, 2021	Data AugmentationDiversity	—Unverified
OOWL500: Overcoming Dataset Collection Bias in the Wild	Aug 24, 2021	Adversarial AttackData Augmentation	—Unverified
Influence-guided Data Augmentation for Neural Tensor Completion	Aug 23, 2021	Data AugmentationImputation	CodeCode Available
Deploying a BERT-based Query-Title Relevance Classifier in a Production System: a View from the Trenches	Aug 23, 2021	CPUData Augmentation	—Unverified
Sarcasm Detection in Twitter -- Performance Impact while using Data Augmentation: Word Embeddings	Aug 23, 2021	Data AugmentationOpinion Mining	CodeCode Available
DTWSSE: Data Augmentation with a Siamese Encoder for Time Series	Aug 23, 2021	Data AugmentationDecoder	—Unverified
A Unified Transformer-based Framework for Duplex Text Normalization	Aug 23, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Data Augmentation Using Many-To-Many RNNs for Session-Aware Recommender Systems	Aug 22, 2021	Data AugmentationRecommendation Systems	CodeCode Available
SemiFed: Semi-supervised Federated Learning with Consistency and Pseudo-Labeling	Aug 21, 2021	Data AugmentationFederated Learning	—Unverified
Mitigating Greenhouse Gas Emissions Through Generative Adversarial Networks Based Wildfire Prediction	Aug 20, 2021	Data AugmentationGenerative Adversarial Network	—Unverified
Neural TMDlayer: Modeling Instantaneous flow of features via SDE Generators	Aug 19, 2021	Data AugmentationFew-Shot Image Classification	CodeCode Available
Perturb, Predict & Paraphrase: Semi-Supervised Learning using Noisy Student for Image Captioning	Aug 19, 2021	Data AugmentationImage Augmentation	CodeCode Available
Segmentation of Lungs COVID Infected Regions by Attention Mechanism and Synthetic Data	Aug 19, 2021	Data AugmentationGenerative Adversarial Network	—Unverified
Augmenting Slot Values and Contexts for Spoken Language Understanding with Pretrained Models	Aug 19, 2021	Data Augmentationslot-filling	CodeCode Available
Scarce Data Driven Deep Learning of Drones via Generalized Data Distribution Space	Aug 18, 2021	Data AugmentationGenerative Adversarial Network	—Unverified
Practical X-ray Gastric Cancer Diagnostic Support Using Refined Stochastic Data Augmentation and Hard Boundary Box Training	Aug 18, 2021	Data AugmentationDiagnostic	CodeCode Available
Directing the violence or admonishing it? A survey of contronymy and androcentrism in Google Translate and some recommendations	Aug 18, 2021	Data AugmentationMachine Translation	CodeCode Available
An Empirical Survey of Data Augmentation \ Limited Data Learning in NLP	Aug 17, 2021	Data AugmentationNews Classification	—Unverified
Adapting Multilingual Models for Code-Mixed Translation using Back-to-Back Translation	Aug 17, 2021	Data AugmentationMachine Translation	—Unverified
A Comparison of Strategies for Source-Free Domain Adaptation	Aug 17, 2021	Active LearningData Augmentation	—Unverified
Tailor: Generating and Perturbing Text with Semantic Controls	Aug 17, 2021	Data AugmentationNatural Language Inference	—Unverified
KCNet: An Insect-Inspired Single-Hidden-Layer Neural Network with Randomized Binary Weights for Prediction and Classification Tasks	Aug 17, 2021	Data Augmentationimage-classification	CodeCode Available
Data Augmentation and CNN Classification For Automatic COVID-19 Diagnosis From CT-Scan Images On Small Dataset	Aug 16, 2021	ClassificationCOVID-19 Diagnosis	—Unverified
Data Efficient Human Intention Prediction: Leveraging Neural Network Verification and Expert Guidance	Aug 16, 2021	Data AugmentationDiversity	—Unverified
ST3D++: Denoised Self-training for Unsupervised Domain Adaptation on 3D Object Detection	Aug 15, 2021	3D Object DetectionData Augmentation	—Unverified

Show:10 25 50

← PrevPage 122 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified