Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2951–3000 of 8378 papers

Title	Date	Tasks	Status	Hype
SASMU: boost the performance of generalized recognition model using synthetic face dataset	Jun 2, 2023	Data AugmentationDomain Generalization	—Unverified	0
Quantifying Sample Anonymity in Score-Based Generative Models with Adversarial Fingerprinting	Jun 2, 2023	Anomaly DetectionData Augmentation	—Unverified	0
EPIC: Graph Augmentation with Edit Path Interpolation via Learnable Cost	Jun 2, 2023	Data AugmentationGraph Classification	—Unverified	0
Simple Data Augmentation Techniques for Chinese Disease Normalization	Jun 2, 2023	Data Augmentation	CodeCode Available	0
Improving the Robustness of Summarization Systems with Dual Augmentation	Jun 1, 2023	Data AugmentationDecoder	CodeCode Available	1
Addressing Discrepancies in Semantic and Visual Alignment in Neural Networks	Jun 1, 2023	Data Augmentationimage-classification	—Unverified	0
A Multi-dimensional Deep Structured State Space Approach to Speech Enhancement Using Small-footprint Models	Jun 1, 2023	Data AugmentationSpeech Enhancement	CodeCode Available	1
Understanding Augmentation-based Self-Supervised Representation Learning via RKHS Approximation and Regression	Jun 1, 2023	Contrastive LearningData Augmentation	—Unverified	0
AfriNames: Most ASR models "butcher" African Names	Jun 1, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
CAISA at SemEval-2023 Task 8: Counterfactual Data Augmentation for Mitigating Class Imbalance in Causal Claim Identification	Jun 1, 2023	counterfactualData Augmentation	—Unverified	0
A Novel Driver Distraction Behavior Detection Method Based on Self-supervised Learning with Masked Image Modeling	Jun 1, 2023	Data AugmentationSelf-Supervised Learning	CodeCode Available	0
Geo-Tiles for Semantic Segmentation of Earth Observation Imagery	Jun 1, 2023	Data AugmentationEarth Observation	CodeCode Available	1
Provable Benefit of Mixup for Finding Optimal Decision Boundaries	Jun 1, 2023	Data Augmentation	—Unverified	0
ACLM: A Selective-Denoising based Generative Data Augmentation Approach for Low-Resource Complex NER	Jun 1, 2023	Data AugmentationDenoising	CodeCode Available	1
Automatic Data Augmentation for Domain Adapted Fine-Tuning of Self-Supervised Speech Representations	Jun 1, 2023	Data AugmentationDomain Adaptation	—Unverified	0
On the Limitations of Temperature Scaling for Distributions with Overlaps	Jun 1, 2023	Data AugmentationForm	CodeCode Available	0
Fish-TViT: A novel fish species classification method in multi water areas based on transfer learning and vision transformer	May 31, 2023	Data AugmentationTransfer Learning	—Unverified	0
Building Manufacturing Deep Learning Models with Minimal and Imbalanced Training Data Using Domain Adaptation and Data Augmentation	May 31, 2023	Data AugmentationDefect Detection	—Unverified	0
Simple yet Effective Code-Switching Language Identification with Multitask Pre-Training and Transfer Learning	May 31, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Source Code Data Augmentation for Deep Learning: A Survey	May 31, 2023	Data AugmentationDeep Learning	CodeCode Available	1
Multi-Epoch Learning for Deep Click-Through Rate Prediction Models	May 31, 2023	Click-Through Rate PredictionData Augmentation	—Unverified	0
VIPriors 3: Visual Inductive Priors for Data-Efficient Deep Learning Challenges	May 31, 2023	Data AugmentationDeep Learning	—Unverified	0
A Survey of Label-Efficient Deep Learning for 3D Point Clouds	May 31, 2023	Data AugmentationDeep Learning	CodeCode Available	1
Breast Cancer Detection and Diagnosis: A comparative study of state-of-the-arts deep learning architectures	May 31, 2023	Breast Cancer DetectionData Augmentation	—Unverified	0
MSMix:An Interpolation-Based Text Data Augmentation Method Manifold Swap Mixup	May 31, 2023	Data AugmentationIntent Detection	—Unverified	0
Cross Encoding as Augmentation: Towards Effective Educational Text Classification	May 30, 2023	ClassificationData Augmentation	—Unverified	0
A Shapelet-based Framework for Unsupervised Multivariate Time Series Representation Learning	May 30, 2023	Anomaly DetectionData Augmentation	CodeCode Available	1
Data Augmentation Methods of Dynamic Model Identification for Harbor Maneuvers using Feedforward Neural Network	May 30, 2023	Data Augmentation	—Unverified	0
A Recipe for Efficient SBIR Models: Combining Relative Triplet Loss with Batch Normalization and Knowledge Distillation	May 30, 2023	Data AugmentationImage Retrieval	—Unverified	0
ShuffleMix: Improving Representations via Channel-Wise Shuffle of Interpolated Hidden States	May 30, 2023	BenchmarkingData Augmentation	CodeCode Available	0
Simulation-Aided Deep Learning for Laser Ultrasonic Visualization Testing	May 30, 2023	Data AugmentationDeep Learning	—Unverified	0
Joint Optimization of Class-Specific Training- and Test-Time Data Augmentation in Segmentation	May 30, 2023	Data AugmentationImage Segmentation	CodeCode Available	0
Improving Generalization for Multimodal Fake News Detection	May 29, 2023	Data AugmentationFake News Detection	CodeCode Available	0
LM-CPPF: Paraphrasing-Guided Data Augmentation for Contrastive Prompt-Based Few-Shot Fine-Tuning	May 29, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
Conditional Diffusion Models for Semantic 3D Brain MRI Synthesis	May 29, 2023	Data AugmentationImage Generation	CodeCode Available	2
Extrinsic Factors Affecting the Accuracy of Biomedical NER	May 29, 2023	Data Augmentationnamed-entity-recognition	—Unverified	0
Data Augmentation for Low-Resource Keyphrase Generation	May 29, 2023	ArticlesData Augmentation	CodeCode Available	0
On Counterfactual Data Augmentation Under Confounding	May 29, 2023	counterfactualData Augmentation	—Unverified	0
Improved Probabilistic Image-Text Representations	May 29, 2023	Data AugmentationImage-text matching	CodeCode Available	1
Augmenting Character Designers Creativity Using Generative Adversarial Networks	May 28, 2023	Data AugmentationTransfer Learning	—Unverified	0
Targeted Data Generation: Finding and Fixing Model Weaknesses	May 28, 2023	Data AugmentationNatural Language Inference	—Unverified	0
Spot keywords from very noisy and mixed speech	May 28, 2023	Data AugmentationKeyword Spotting	—Unverified	0
Disambiguated Lexically Constrained Neural Machine Translation	May 27, 2023	Data AugmentationMachine Translation	—Unverified	0
GIMM: InfoMin-Max for Automated Graph Contrastive Learning	May 27, 2023	Contrastive LearningData Augmentation	—Unverified	0
SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended)	May 26, 2023	Data AugmentationIn-Context Learning	—Unverified	0
Double Descent and Overfitting under Noisy Inputs and Distribution Shift for Linear Denoisers	May 26, 2023	Data AugmentationDenoising	—Unverified	0
CREST: A Joint Framework for Rationalization and Counterfactual Text Generation	May 26, 2023	counterfactualData Augmentation	CodeCode Available	0
Leveraging Domain Knowledge for Inclusive and Bias-aware Humanitarian Response Entry Classification	May 26, 2023	counterfactualData Augmentation	CodeCode Available	0
TADA: Task-Agnostic Dialect Adapters for English	May 26, 2023	Data Augmentation	CodeCode Available	0
GDA: Generative Data Augmentation Techniques for Relation Extraction Tasks	May 26, 2023	Data AugmentationRelation	—Unverified	0

Show:10 25 50

← PrevPage 60 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified