Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4351–4400 of 8378 papers

Title	Date	Tasks	Status
Optimizing Sentence Embedding with Pseudo-Labeling and Model Ensembles: A Hierarchical Framework for Enhanced NLP Tasks	Jan 27, 2025	Data AugmentationPseudo Label	—Unverified
Optimizing the AI Development Process by Providing the Best Support Environment	Apr 29, 2023	Data AugmentationManagement	—Unverified
Order Doesn't Matter, But Reasoning Does: Training LLMs with Order-Centric Augmentation	Feb 27, 2025	Data AugmentationLogical Reasoning	—Unverified
Order-sensitive Shapley Values for Evaluating Conceptual Soundness of NLP Models	Jun 1, 2022	Data AugmentationNegation	—Unverified
orGAN: A Synthetic Data Augmentation Pipeline for Simultaneous Generation of Surgical Images and Ground Truth Labels	Jun 17, 2025	Data AugmentationDiversity	—Unverified
Original or Translated? On the Use of Parallel Data for Translation Quality Estimation	Dec 20, 2022	Data AugmentationMachine Translation	—Unverified
Ortho-Shot: Low Displacement Rank Regularization with Data Augmentation for Few-Shot Learning	Oct 18, 2021	Data AugmentationDiversity	—Unverified
OR-UNet: an Optimized Robust Residual U-Net for Instrument Segmentation in Endoscopic Images	Apr 27, 2020	Data AugmentationImage Segmentation	—Unverified
OT-Attack: Enhancing Adversarial Transferability of Vision-Language Models via Optimal Transport Optimization	Dec 7, 2023	Adversarial AttackData Augmentation	—Unverified
Outlier-aware Tensor Robust Principal Component Analysis with Self-guided Data Augmentation	Apr 25, 2025	Computational EfficiencyData Augmentation	—Unverified
Test-Time Fairness and Robustness in Large Language Models	Jun 11, 2024	Causal Inferencecounterfactual	—Unverified
Output Feedback Tube MPC-Guided Data Augmentation for Robust, Efficient Sensorimotor Policy Learning	Oct 18, 2022	Data AugmentationImitation Learning	—Unverified
Overcoming Data Scarcity in Generative Language Modelling for Low-Resource Languages: A Systematic Review	May 7, 2025	Data AugmentationLanguage Modelling	—Unverified
Overcoming limited battery data challenges: A coupled neural network approach	Oct 5, 2021	Data AugmentationTime Series	—Unverified
Overlapping Word Removal is All You Need: Revisiting Data Imbalance in Hope Speech Detection	Apr 12, 2022	AllData Augmentation	—Unverified
Student Specialization in Deep ReLU Networks With Finite Width and Input Dimension	Sep 30, 2019	Data AugmentationInductive Bias	—Unverified
Overview of the TalentCLEF 2025: Skill and Job Title Intelligence for Human Capital Management	Jul 17, 2025	Contrastive LearningData Augmentation	—Unverified
P^2 Net: Augmented Parallel-Pyramid Net for Attention Guided Pose Estimation	Oct 26, 2020	Data AugmentationPose Estimation	—Unverified
PAC Learnability under Explanation-Preserving Graph Perturbations	Feb 7, 2024	Data Augmentation	—Unverified
PAC-tuning:Fine-tuning Pretrained Language Models with PAC-driven Perturbed Gradient Descent	Oct 26, 2023	Data AugmentationFew-Shot Learning	—Unverified
Paired Cross-Modal Data Augmentation for Fine-Grained Image-to-Text Retrieval	Jul 29, 2022	Cross-Modal RetrievalData Augmentation	—Unverified
PALI at SemEval-2021 Task 2: Fine-Tune XLM-RoBERTa for Word in Context Disambiguation	Apr 21, 2021	Data AugmentationTAG	—Unverified
PaMMA-Net: Plasmas magnetic measurement evolution based on data-driven incremental accumulative prediction	Jan 23, 2025	Data AugmentationDeep Learning	—Unverified
MAC: A unified framework boosting low resource automatic speech recognition	Feb 5, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
PANDA: AdaPtive Noisy Data Augmentation for Regularization of Undirected Graphical Models	Oct 11, 2018	Data AugmentationVariable Selection	—Unverified
PanDA: Panoptic Data Augmentation	Nov 27, 2019	Data AugmentationInstance Segmentation	—Unverified
PanoMixSwap Panorama Mixing via Structural Swapping for Indoor Scene Understanding	Sep 18, 2023	Data AugmentationDiversity	—Unverified
Panoptic Out-of-Distribution Segmentation	Oct 18, 2023	Data AugmentationInstance Segmentation	—Unverified
Parallel Recurrent Data Augmentation for GAN training with Limited and Diverse Data	Mar 25, 2019	Data AugmentationImage Generation	—Unverified
Parallel resources for Tunisian Arabic Dialect Translation	Dec 1, 2020	Data AugmentationMachine Translation	—Unverified
Parameter Efficient Audio Captioning With Faithful Guidance Using Audio-text Shared Latent Representation	Sep 6, 2023	Audio captioningData Augmentation	—Unverified
Parameterizing Context: Unleashing the Power of Parameter-Efficient Fine-Tuning and In-Context Tuning for Continual Table Semantic Parsing	Oct 7, 2023	Continual LearningData Augmentation	—Unverified
Parametric Implicit Face Representation for Audio-Driven Facial Reenactment	Jun 13, 2023	Data AugmentationImage Generation	—Unverified
Parametric Variational Linear Units (PVLUs) in Deep Convolutional Networks	Oct 23, 2021	Data AugmentationTransfer Learning	—Unverified
Paraphrasing via Ranking Many Candidates	Jul 20, 2021	Data Augmentation	—Unverified
ParaZh-22M: A Large-Scale Chinese Parabank via Machine Translation	Oct 1, 2022	Data AugmentationMachine Translation	—Unverified
Partial differential equation regularization for supervised machine learning	Oct 3, 2019	BIG-bench Machine LearningClassification	—Unverified
Partial Face Detection in the Mobile Domain	Apr 7, 2017	Binary ClassificationData Augmentation	—Unverified
Partially fake it till you make it: mixing real and fake thermal images for improved object detection	Jun 25, 2021	Data Augmentationobject-detection	—Unverified
ParticleAugment: Sampling-Based Data Augmentation	Jun 16, 2021	Data Augmentationimage-classification	—Unverified
Parting with Illusions about Deep Active Learning	Dec 11, 2019	Active LearningData Augmentation	—Unverified
Partitioning Image Representation in Contrastive Learning	Mar 20, 2022	Contrastive LearningData Augmentation	—Unverified
PartMix: Regularization Strategy to Learn Part Discovery for Visible-Infrared Person Re-identification	Apr 4, 2023	Contrastive LearningData Augmentation	—Unverified
Part Segmentation for Highly Accurate Deformable Tracking in Occlusions via Fully Convolutional Neural Networks	Aug 5, 2019	Data AugmentationPose Estimation	—Unverified
PASS3D: Precise and Accelerated Semantic Segmentation for 3D Point Cloud	Sep 4, 2019	Autonomous DrivingData Augmentation	—Unverified
PASTS: Progress-Aware Spatio-Temporal Transformer Speaker For Vision-and-Language Navigation	May 19, 2023	Data AugmentationVision and Language Navigation	—Unverified
Patch-aware Batch Normalization for Improving Cross-domain Robustness	Apr 6, 2023	Data Augmentationobject-detection	—Unverified
PatchMix Augmentation to Identify Causal Features in Few-shot Learning	Nov 29, 2022	Data AugmentationFew-Shot Learning	—Unverified
Patch Reordering: a Novel Way to Achieve Rotation and Translation Invariance in Convolutional Neural Networks	Nov 28, 2019	Data AugmentationImage Retrieval	—Unverified
Patch Stitching Data Augmentation for Cancer Classification in Pathology Images	Feb 22, 2025	Cancer ClassificationData Augmentation	—Unverified

Show:10 25 50

← PrevPage 88 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified