Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6751–6800 of 8378 papers

Title	Date	Tasks	Status
On the Performance of Convolutional Neural Networks under High and Low Frequency Information	Oct 30, 2020	Data AugmentationFace Recognition	—Unverified
Acoustic Scene Classification with Squeeze-Excitation Residual Networks	Mar 20, 2020	Acoustic Scene ClassificationClassification	—Unverified
On the Pitfalls of Learning with Limited Data: A Facial Expression Recognition Case Study	Apr 2, 2021	Data AugmentationDeep Learning	—Unverified
On the Reproducibility of Neural Network Predictions	Feb 5, 2021	Data Augmentationimage-classification	—Unverified
On the Robustness of Human-Object Interaction Detection against Distribution Shift	Jun 22, 2025	BenchmarkingData Augmentation	—Unverified
On the Robustness of Speech Emotion Recognition for Human-Robot Interaction with Deep Neural Networks	Apr 6, 2018	Data AugmentationEmotion Recognition	—Unverified
On the Role of Supervision in Unsupervised Constituency Parsing	Oct 6, 2020	Constituency ParsingData Augmentation	—Unverified
On the (Un-)Avoidability of Adversarial Examples	Jun 24, 2021	Adversarial RobustnessData Augmentation	—Unverified
On the Usability of Transformers-based models for a French Question-Answering task	Jul 19, 2022	Cross-Lingual TransferData Augmentation	—Unverified
On the Usefulness of Synthetic Tabular Data Generation	Jun 27, 2023	Data AugmentationData Summarization	—Unverified
On the Way to LLM Personalization: Learning to Remember User Conversations	Nov 20, 2024	Data AugmentationRAG	—Unverified
ON-TRAC Consortium for End-to-End and Simultaneous Speech Translation Challenge Tasks at IWSLT 2020	May 24, 2020	Data AugmentationDecoder	—Unverified
On Training Sketch Recognizers for New Domains	Apr 18, 2021	Data AugmentationSketch Recognition	—Unverified
On Using SpecAugment for End-to-End Speech Translation	Nov 20, 2019	Data AugmentationTranslation	—Unverified
OoMMix: Out-of-manifold Regularization in Contextual Embedding Space for Text Classification	Aug 1, 2021	Data Augmentationtext-classification	—Unverified
OOWL500: Overcoming Dataset Collection Bias in the Wild	Aug 24, 2021	Adversarial AttackData Augmentation	—Unverified
Open data for Moroccan license plates for OCR applications : data collection, labeling, and model construction	Apr 16, 2021	Data AugmentationLicense Plate Recognition	—Unverified
Open Set RF Fingerprinting using Generative Outlier Augmentation	Aug 30, 2021	ClassificationData Augmentation	—Unverified
Open Source Dataset and Machine Learning Techniques for Automatic Recognition of Historical Graffiti	Aug 31, 2018	BIG-bench Machine LearningData Augmentation	—Unverified
Operationalizing Convolutional Neural Network Architectures for Prohibited Object Detection in X-Ray Imagery	Oct 10, 2021	Data AugmentationData Compression	—Unverified
OptGAN: Optimizing and Interpreting the Latent Space of the Conditional Text-to-Image GANs	Feb 25, 2022	Data AugmentationImage Generation	—Unverified
Optical Character Recognition using Convolutional Neural Networks for Ashokan Brahmi Inscriptions	Dec 29, 2024	Data AugmentationImage Segmentation	—Unverified
Optical Flow Techniques for Facial Expression Analysis -- a Practical Evaluation Study	Apr 25, 2019	Data AugmentationFacial Expression Recognition	—Unverified
Optimal Layer Selection for Latent Data Augmentation	Aug 24, 2024	Data Augmentationimage-classification	—Unverified
Optimal Resource Allocation for Serverless Queries	Jul 19, 2021	Data Augmentation	—Unverified
Cardiac Disease Diagnosis on Imbalanced Electrocardiography Data Through Optimal Transport Augmentation	Jan 25, 2022	Data Augmentation	—Unverified
Optimal Transport-Based Displacement Interpolation with Data Augmentation for Reduced Order Modeling of Nonlinear Dynamical Systems	Nov 13, 2024	Data Augmentation	—Unverified
Integrating Semantic Knowledge to Tackle Zero-shot Text Classification	Mar 29, 2019	ClassificationData Augmentation	CodeCode Available
ByPE-VAE: Bayesian Pseudocoresets Exemplar VAE	Jul 20, 2021	Data AugmentationDensity Estimation	CodeCode Available
Training Structured Neural Networks Through Manifold Identification and Variance Reduction	Dec 5, 2021	Data Augmentation	CodeCode Available
Integrating Contrastive Learning with Dynamic Models for Reinforcement Learning from Images	Mar 2, 2022	Contrastive LearningData Augmentation	CodeCode Available
InstaBoost: Boosting Instance Segmentation via Probability Map Guided Copy-Pasting	Aug 21, 2019	Data AugmentationInstance Segmentation	CodeCode Available
Practical Deep Learning with Bayesian Principles	Jun 6, 2019	Continual LearningData Augmentation	CodeCode Available
Analytical Moment Regularizer for Gaussian Robust Networks	Apr 24, 2019	Data Augmentation	CodeCode Available
Practical Transformer-based Multilingual Text Classification	Jun 1, 2021	ClassificationData Augmentation	CodeCode Available
InsMix: Towards Realistic Generative Data Augmentation for Nuclei Instance Segmentation	Jun 30, 2022	Data AugmentationInstance Segmentation	CodeCode Available
Practice Makes a Solver Perfect: Data Augmentation for Math Word Problem Solvers	Apr 30, 2022	Data AugmentationDiversity	CodeCode Available
Simple Noisy Environment Augmentation for Reinforcement Learning	May 4, 2023	Data AugmentationDiversity	CodeCode Available
PreCogIIITH at HinglishEval : Leveraging Code-Mixing Metrics & Language Model Embeddings To Estimate Code-Mix Quality	Jun 16, 2022	Data AugmentationLanguage Modeling	CodeCode Available
Leveraging QA Datasets to Improve Generative Data Augmentation	May 25, 2022	Common Sense ReasoningData Augmentation	CodeCode Available
Insect Identification in the Wild: The AMI Dataset	Jun 18, 2024	Data AugmentationDiversity	CodeCode Available
Precog-LTRC-IIITH at GermEval 2021: Ensembling Pre-Trained Language Models with Feature Engineering	Sep 1, 2021	Data AugmentationFeature Engineering	CodeCode Available
1st Place Solution for ECCV 2022 OOD-CV Challenge Image Classification Track	Jan 12, 2023	Data AugmentationDomain Adaptation	CodeCode Available
Predicting Brain Multigraph Population From a Single Graph Template for Boosting One-Shot Classification	Sep 13, 2022	Data AugmentationGraph Neural Network	CodeCode Available
Predicting Confusion from Eye-Tracking Data with Recurrent Neural Networks	Jun 19, 2019	Data AugmentationSensitivity	CodeCode Available
Artificial Intelligence for Biomedical Video Generation	Nov 12, 2024	Data AugmentationVideo Generation	CodeCode Available
Simplicial Regularization	Mar 8, 2021	Data AugmentationDimensionality Reduction	CodeCode Available
Interpretability-guided Data Augmentation for Robust Segmentation in Multi-centre Colonoscopy Data	Aug 30, 2023	Data AugmentationImage Segmentation	CodeCode Available
Exploring the Landscape of Spatial Robustness	Dec 7, 2017	Adversarial RobustnessData Augmentation	CodeCode Available
Simplifying Neural Network Training Under Class Imbalance	Dec 5, 2023	Data AugmentationDeep Learning	CodeCode Available

Show:10 25 50

← PrevPage 136 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified