Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2351–2400 of 8378 papers

Title	Date	Tasks	Status	Hype
Lie Point Symmetry and Physics Informed Networks	Nov 7, 2023	Data AugmentationInductive Bias	—Unverified	0
Augmenting Radio Signals with Wavelet Transform for Deep Learning-Based Modulation Recognition	Nov 7, 2023	Data AugmentationDiversity	—Unverified	0
Improving the Effectiveness of Deep Generative Data	Nov 7, 2023	Data Augmentationimage-classification	—Unverified	0
Spoken Dialogue System for Medical Prescription Acquisition on Smartphone: Development, Corpus and Evaluation	Nov 6, 2023	Data Augmentation	—Unverified	0
MixUp-MIL: A Study on Linear & Multilinear Interpolation-Based Data Augmentation for Whole Slide Image Classification	Nov 6, 2023	Data Augmentationimage-classification	—Unverified	0
Model-based Counterfactual Generator for Gender Bias Mitigation	Nov 6, 2023	counterfactualData Augmentation	—Unverified	0
Few-shot Learning using Data Augmentation and Time-Frequency Transformation for Time Series Classification	Nov 6, 2023	Data AugmentationFew-Shot Learning	—Unverified	0
DAIL: Data Augmentation for In-Context Learning via Self-Paraphrase	Nov 6, 2023	Data AugmentationIn-Context Learning	—Unverified	0
Co-training and Co-distillation for Quality Improvement and Compression of Language Models	Nov 6, 2023	Data AugmentationKnowledge Distillation	—Unverified	0
Augment the Pairs: Semantics-Preserving Image-Caption Pair Augmentation for Grounding-Based Vision and Language Models	Nov 5, 2023	Data AugmentationPhrase Grounding	CodeCode Available	0
SSL-DG: Rethinking and Fusing Semi-supervised Learning and Domain Generalization in Medical Image Segmentation	Nov 5, 2023	Data AugmentationDomain Generalization	CodeCode Available	0
TreeSwap: Data Augmentation for Machine Translation via Dependency Subtree Swapping	Nov 4, 2023	Data AugmentationMachine Translation	CodeCode Available	0
Using DUCK-Net for Polyp Image Segmentation	Nov 3, 2023	Data AugmentationDecoder	CodeCode Available	1
Comparative Knowledge Distillation	Nov 3, 2023	Data AugmentationKnowledge Distillation	CodeCode Available	0
Vicinal Risk Minimization for Few-Shot Cross-lingual Transfer in Abusive Language Detection	Nov 3, 2023	Abusive LanguageCross-Lingual Transfer	—Unverified	0
Noise-Agnostic Quantum Error Mitigation with Data Augmented Neural Models	Nov 3, 2023	Data Augmentation	CodeCode Available	0
Distilling Out-of-Distribution Robustness from Vision-Language Foundation Models	Nov 2, 2023	Data AugmentationDomain Generalization	CodeCode Available	1
People Make Better Edits: Measuring the Efficacy of LLM-Generated Counterfactually Augmented Data for Harmful Language Detection	Nov 2, 2023	Data Augmentation	CodeCode Available	0
Improving Robustness via Tilted Exponential Layer: A Communication-Theoretic Perspective	Nov 2, 2023	Data Augmentation	CodeCode Available	0
Tailoring Mixup to Data for Calibration	Nov 2, 2023	Data AugmentationDiversity	CodeCode Available	0
Concatenated Masked Autoencoders as Spatial-Temporal Learner	Nov 2, 2023	Action RecognitionData Augmentation	CodeCode Available	1
Deep Double Descent for Time Series Forecasting: Avoiding Undertrained Models	Nov 2, 2023	Data AugmentationTime Series	—Unverified	0
C2C: Cough to COVID-19 Detection in BHI 2023 Data Challenge	Nov 1, 2023	COVID-19 DiagnosisData Augmentation	CodeCode Available	0
Data Augmentation for Code Translation with Comparable Corpora and Multiple References	Nov 1, 2023	Code GenerationCode Translation	CodeCode Available	0
Rethinking Samples Selection for Contrastive Learning: Mining of Potential Samples	Nov 1, 2023	Contrastive LearningData Augmentation	—Unverified	0
DEFN: Dual-Encoder Fourier Group Harmonics Network for Three-Dimensional Indistinct-Boundary Object Segmentation	Nov 1, 2023	3D ReconstructionData Augmentation	CodeCode Available	1
Bayes-enhanced Multi-view Attention Networks for Robust POI Recommendation	Nov 1, 2023	Data AugmentationRepresentation Learning	—Unverified	0
Dynamic Batch Norm Statistics Update for Natural Robustness	Oct 31, 2023	Data Augmentation	—Unverified	0
Thermal-Infrared Remote Target Detection System for Maritime Rescue based on Data Augmentation with 3D Synthetic Data	Oct 31, 2023	Data AugmentationDomain Adaptation	—Unverified	0
Is Robustness Transferable across Languages in Multilingual Neural Machine Translation?	Oct 31, 2023	Data AugmentationMachine Translation	—Unverified	0
Histopathological Image Analysis with Style-Augmented Feature Domain Mixing for Improved Generalization	Oct 31, 2023	Data AugmentationDomain Generalization	CodeCode Available	0
Addressing Limitations of State-Aware Imitation Learning for Autonomous Driving	Oct 31, 2023	Autonomous DrivingData Augmentation	—Unverified	0
A Lightweight Method to Generate Unanswerable Questions in English	Oct 30, 2023	Data AugmentationQuestion Answering	CodeCode Available	0
A Note on Generalization in Variational Autoencoders: How Effective Is Synthetic Data & Overparameterization?	Oct 30, 2023	Data AugmentationDeep Learning	—Unverified	0
TeacherLM: Teaching to Fish Rather Than Giving the Fish, Language Modeling Likewise	Oct 29, 2023	Data AugmentationLanguage Modeling	—Unverified	0
On Linear Separation Capacity of Self-Supervised Representation Learning	Oct 29, 2023	Data AugmentationRepresentation Learning	—Unverified	0
Empowering Collaborative Filtering with Principled Adversarial Contrastive Loss	Oct 28, 2023	Collaborative FilteringContrastive Learning	CodeCode Available	1
ODM3D: Alleviating Foreground Sparsity for Semi-Supervised Monocular 3D Object Detection	Oct 28, 2023	3D Object DetectionAutonomous Driving	CodeCode Available	0
Exploring Data Augmentations on Self-/Semi-/Fully- Supervised Pre-trained Models	Oct 28, 2023	Data AugmentationDiversity	—Unverified	0
OC-NMN: Object-centric Compositional Neural Module Network for Generative Visual Analogical Reasoning	Oct 28, 2023	Data AugmentationOut-of-Distribution Generalization	—Unverified	0
Learning to Search Feasible and Infeasible Regions of Routing Problems with Flexible Neural k-Opt	Oct 27, 2023	Data AugmentationDecoder	CodeCode Available	1
MixRep: Hidden Representation Mixup for Low-Resource Speech Recognition	Oct 27, 2023	Data Augmentationspeech-recognition	CodeCode Available	0
Instance Segmentation under Occlusions via Location-aware Copy-Paste Data Augmentation	Oct 27, 2023	Data AugmentationInstance Segmentation	CodeCode Available	1
Large-scale Foundation Models and Generative AI for BigData Neuroscience	Oct 27, 2023	Data AugmentationNatural Language Understanding	—Unverified	0
Guided Data Augmentation for Offline Reinforcement Learning and Imitation Learning	Oct 27, 2023	Autonomous DrivingD4RL	—Unverified	0
Semi-Supervised Panoptic Narrative Grounding	Oct 27, 2023	Data AugmentationPseudo Label	CodeCode Available	1
Better integrating vision and semantics for improving few-shot classification	Oct 26, 2023	Data AugmentationPrompt Engineering	CodeCode Available	0
Understanding when Dynamics-Invariant Data Augmentations Benefit Model-Free Reinforcement Learning Updates	Oct 26, 2023	Data Augmentationreinforcement-learning	CodeCode Available	0
Dialect Adaptation and Data Augmentation for Low-Resource ASR: TalTech Systems for the MADASR 2023 Challenge	Oct 26, 2023	Automatic Speech RecognitionData Augmentation	—Unverified	0
PAC-tuning:Fine-tuning Pretrained Language Models with PAC-driven Perturbed Gradient Descent	Oct 26, 2023	Data AugmentationFew-Shot Learning	—Unverified	0

Show:10 25 50

← PrevPage 48 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified