Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7601–7650 of 8378 papers

Title	Date	Tasks	Status
HateGAN: Adversarial Generative-Based Data Augmentation for Hate Speech Detection	Dec 1, 2020	Data AugmentationHate Speech Detection	—Unverified
HATERecognizer at SemEval-2019 Task 5: Using Features and Neural Networks to Face Hate Recognition	Jun 1, 2019	Data Augmentation	—Unverified
Hate Speech Detection in Limited Data Contexts using Synthetic Data Generation	Oct 4, 2023	Data AugmentationHate Speech Detection	—Unverified
HCS at SemEval-2017 Task 5: Polarity detection in business news using convolutional neural networks	Aug 1, 2017	Data AugmentationSentiment Analysis	—Unverified
hdl2v: A Code Translation Dataset for Enhanced LLM Verilog Generation	Jun 5, 2025	Code GenerationCode Translation	—Unverified
Heavy-tailed Representations, Text Polarity Classification & Data Augmentation	Mar 25, 2020	AttributeClassification	—Unverified
HEp-2 Cell Image Classification with Deep Convolutional Neural Networks	Apr 10, 2015	ClassificationData Augmentation	—Unverified
Heterogeneous Contrastive Learning: Encoding Spatial Information for Compact Visual Representations	Nov 19, 2020	Contrastive LearningData Augmentation	—Unverified
Heterogeneous Face Recognition via Face Synthesis with Identity-Attribute Disentanglement	Jun 10, 2022	AttributeData Augmentation	—Unverified
Heterogeneous Graph Contrastive Learning with Spectral Augmentation	Jun 30, 2024	Contrastive LearningData Augmentation	—Unverified
Heterogeneous Recycle Generation for Chinese Grammatical Error Correction	Dec 1, 2020	Data AugmentationGrammatical Error Correction	—Unverified
HiBid: A Cross-Channel Constrained Bidding System with Budget Allocation by Hierarchical Offline Deep Reinforcement Learning	Dec 29, 2023	Data AugmentationDeep Reinforcement Learning	—Unverified
Hide and Seek: How Does Watermarking Impact Face Recognition?	Apr 29, 2024	Data AugmentationDecoder	—Unverified
Hierarchical Scene Coordinate Classification and Regression for Visual Localization	Sep 13, 2019	ClassificationData Augmentation	—Unverified
Hierarchical Neural Data Synthesis for Semantic Parsing	Dec 4, 2021	Data AugmentationSemantic Parsing	—Unverified
Hierarchical Topic Presence Models	Apr 16, 2021	Data AugmentationTopic Models	—Unverified
High-Dimensional Regression with Gaussian Mixtures and Partially-Latent Response Variables	Aug 10, 2013	Data AugmentationDimensionality Reduction	—Unverified
High-frequency shape recovery from shading by CNN and domain adaptation	Aug 6, 2021	Data AugmentationDomain Adaptation	—Unverified
Fusion Self-supervised Learning for Recommendation	Jul 29, 2024	Contrastive LearningData Augmentation	—Unverified
High performing ensemble of convolutional neural networks for insect pest image detection	Aug 28, 2021	Data Augmentation	—Unverified
High-Quality Data Augmentation for Low-Resource NMT: Combining a Translation Memory, a GAN Generator, and Filtering	Aug 22, 2024	Data AugmentationGenerative Adversarial Network	—Unverified
High-Resolution Mammogram Synthesis using Progressive Generative Adversarial Networks	Jul 9, 2018	Data AugmentationImage Generation	—Unverified
High-Resolution UAV Image Generation for Sorghum Panicle Detection	May 8, 2022	Data AugmentationImage Generation	—Unverified
HILGEN: Hierarchically-Informed Data Generation for Biomedical NER Using Knowledgebases and Large Language Models	Mar 6, 2025	Data AugmentationNER	—Unverified
HintedBT: Augmenting Back-Translation with Quality and Transliteration Hints	Sep 9, 2021	Data AugmentationDecoder	—Unverified
HIPODE: Enhancing Offline Reinforcement Learning with High-Quality Synthetic Data from a Policy-Decoupled Approach	Jun 10, 2023	D4RLData Augmentation	—Unverified
HMM-based data augmentation for E2E systems for building conversational speech synthesis systems	Dec 22, 2022	Data AugmentationLanguage Modeling	—Unverified
HOGSA: Bimanual Hand-Object Interaction Understanding with 3D Gaussian Splatting Based Data Augmentation	Jan 6, 2025	3DGSData Augmentation	—Unverified
Horses to Zebras: Ontology-Guided Data Augmentation and Synthesis for ICD-9 Coding	May 1, 2022	Data Augmentation	—Unverified
How Does Data Diversity Shape the Weight Landscape of Neural Networks?	Oct 18, 2024	Data AugmentationDiversity	—Unverified
How Does Frequency Bias Affect the Robustness of Neural Image Classifiers against Common Corruption and Adversarial Perturbations?	May 9, 2022	Data Augmentation	—Unverified
How Does Mixup Help With Robustness and Generalization?	Oct 9, 2020	Data Augmentation	—Unverified
How Effective is Task-Agnostic Data Augmentation for Pretrained Transformers?	Oct 5, 2020	Data AugmentationTranslation	—Unverified
How low is too low? A monolingual take on lemmatisation in Indian languages	Jun 1, 2021	Data AugmentationLemmatization	—Unverified
How many labeled license plates are needed?	Aug 25, 2018	Data AugmentationLicense Plate Recognition	—Unverified
How Robust are Randomized Smoothing based Defenses to Data Poisoning?	Dec 2, 2020	Adversarial RobustnessBilevel Optimization	—Unverified
How Tempering Fixes Data Augmentation in Bayesian Neural Networks	May 27, 2022	Data Augmentation	—Unverified
How to augment your ViTs? Consistency loss and StyleAug, a random style transfer augmentation	Dec 16, 2021	Data Augmentationimage-classification	—Unverified
How to choose "Good" Samples for Text Data Augmentation	Feb 2, 2023	Data AugmentationSemantic Similarity	—Unverified
How to Make Neural Natural Language Generation as Reliable as Templates in Task-Oriented Dialogue	Nov 1, 2020	Data AugmentationDiversity	—Unverified
How to Select One Among All ? An Empirical Study Towards the Robustness of Knowledge Distillation in Natural Language Understanding	Nov 1, 2021	Adversarial RobustnessAll	—Unverified
How to Tame Your Data: Data Augmentation for Dialog State Tracking	Jul 1, 2020	Data Augmentationdialog state tracking	—Unverified
How to Train Your DRAGON: Diverse Augmentation Towards Generalizable Dense Retrieval	Feb 15, 2023	Contrastive LearningData Augmentation	—Unverified
How we won BraTS 2023 Adult Glioma challenge? Just faking it! Enhanced Synthetic Data Augmentation and Model Ensemble for brain tumour segmentation	Feb 27, 2024	Data AugmentationDeep Learning	—Unverified
How Will It Drape Like? Capturing Fabric Mechanics from Depth Images	Apr 13, 2023	Data AugmentationMaterial Recognition	—Unverified
HpEIS: Learning Hand Pose Embeddings for Multimedia Interactive Systems	Oct 11, 2024	Data Augmentation	—Unverified
Human Age Estimation from Gene Expression Data using Artificial Neural Networks	Nov 4, 2021	Age EstimationData Augmentation	—Unverified
Human-centered Interactive Learning via MLLMs for Text-to-Image Person Re-identification	May 21, 2025	Data AugmentationLarge Language Model	—Unverified
Human Image Generation: A Comprehensive Survey	Dec 17, 2022	Data AugmentationImage Generation	—Unverified
Human-in-the-loop online multi-agent approach to increase trustworthiness in ML models through trust scores and data augmentation	Apr 29, 2022	Data AugmentationTransfer Learning	—Unverified

Show:10 25 50

← PrevPage 153 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified