Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7901–7950 of 8378 papers

Title	Date	Tasks	Status
Systematically designing better instance counting models on cell images with Neural Arithmetic Logic Units	Apr 14, 2020	Data Augmentationregression	CodeCode Available
NIV-SSD: Neighbor IoU-Voting Single-Stage Object Detector From Point Cloud	Jan 23, 2024	ClassificationData Augmentation	CodeCode Available
Do Invariances in Deep Neural Networks Align with Human Perception?	Nov 29, 2021	Data AugmentationSelf-Supervised Learning	CodeCode Available
An Efficient and Layout-Independent Automatic License Plate Recognition System Based on the YOLO detector	Sep 4, 2019	Data AugmentationGPU	CodeCode Available
Exploiting Language Relatedness for Low Web-Resource Language Model Adaptation: An Indic Languages Study	Jun 7, 2021	Data AugmentationLanguage Modeling	CodeCode Available
AENet: Learning Deep Audio Features for Video Analysis	Jan 3, 2017	Action RecognitionData Augmentation	CodeCode Available
NLPineers@ NLU of Devanagari Script Languages 2025: Hate Speech Detection using Ensembling of BERT-based models	Dec 11, 2024	Data AugmentationHate Speech Detection	CodeCode Available
ConvBoost: Boosting ConvNets for Sensor-based Activity Recognition	May 22, 2023	Activity RecognitionData Augmentation	CodeCode Available
Data Augmentation through Expert-guided Symmetry Detection to Improve Performance in Offline Reinforcement Learning	Dec 18, 2021	Data AugmentationDensity Estimation	CodeCode Available
Explanation-based Data Augmentation for Image Classification	Dec 1, 2021	ClassificationData Augmentation	CodeCode Available
SCORE: Self-supervised Correspondence Fine-tuning for Improved Content Representations	Mar 10, 2024	Automatic Speech RecognitionData Augmentation	CodeCode Available
Explaining Full-disk Deep Learning Model for Solar Flare Prediction using Attribution Methods	Jul 29, 2023	Data AugmentationPrediction	CodeCode Available
EXPLAIN, EDIT, GENERATE: Rationale-Sensitive Counterfactual Data Augmentation for Multi-hop Fact Verification	Oct 23, 2023	counterfactualData Augmentation	CodeCode Available
Data Augmentation for Surgical Scene Segmentation with Anatomy-Aware Diffusion Models	Oct 10, 2024	AnatomyData Augmentation	CodeCode Available
An Effective Deployment of Diffusion LM for Data Augmentation in Low-Resource Sentiment Classification	Sep 5, 2024	Data AugmentationDiversity	CodeCode Available
SDA: Simple Discrete Augmentation for Contrastive Sentence Representation Learning	Oct 8, 2022	Contrastive LearningData Augmentation	CodeCode Available
Controllable User Dialogue Act Augmentation for Dialogue State Tracking	Jul 26, 2022	Data AugmentationDialogue State Tracking	CodeCode Available
Noise Stability Optimization for Finding Flat Minima: A Hessian-based Regularization Approach	Jun 14, 2023	Data Augmentationimage-classification	CodeCode Available
Synthesizing Traffic Datasets using Graph Neural Networks	Dec 8, 2023	Data AugmentationGenerative Adversarial Network	CodeCode Available
ANDA: A Novel Data Augmentation Technique Applied to Salient Object Detection	Oct 3, 2019	Data AugmentationImage Augmentation	CodeCode Available
Explainable Deep Learning-based Solar Flare Prediction with post hoc Attention for Operational Forecasting	Aug 4, 2023	Data AugmentationSolar Flare Prediction	CodeCode Available
Advising OpenMP Parallelization via a Graph-Based Approach with Transformers	May 16, 2023	Data Augmentation	CodeCode Available
Anchor Data Augmentation	Nov 12, 2023	Data Augmentationregression	CodeCode Available
Explainability of Deep Neural Networks for Brain Tumor Detection	Oct 10, 2024	Data AugmentationDecision Making	CodeCode Available
Noisy Self-Training with Data Augmentations for Offensive and Hate Speech Detection Tasks	Jul 31, 2023	Data AugmentationHate Speech Detection	CodeCode Available
Accept Synthetic Objects as Real: End-to-End Training of Attentive Deep Visuomotor Policies for Manipulation in Clutter	Sep 24, 2019	Data AugmentationImitation Learning	CodeCode Available
Contrastive Learning with Prompt-derived Virtual Semantic Prototypes for Unsupervised Sentence Embedding	Nov 7, 2022	ClusteringContrastive Learning	CodeCode Available
Augmentor: An Image Augmentation Library for Machine Learning	Aug 11, 2017	BIG-bench Machine LearningData Augmentation	CodeCode Available
Second language Korean Universal Dependency treebank v1.2: Focus on data augmentation and annotation scheme refinement	Mar 18, 2025	Data Augmentation	CodeCode Available
Contrastive Learning with Consistent Representations	Feb 3, 2023	Contrastive LearningData Augmentation	CodeCode Available
Variable Skipping for Autoregressive Range Density Estimation	Jul 10, 2020	Data AugmentationDensity Estimation	CodeCode Available
Watch out Venomous Snake Species: A Solution to SnakeCLEF2023	Jul 19, 2023	Data Augmentation	CodeCode Available
Contrastive Learning for Character Detection in Ancient Greek Papyri	Sep 16, 2024	Contrastive LearningData Augmentation	CodeCode Available
Consistency Regularization for Domain Generalization with Logit Attribution Matching	May 13, 2023	Data AugmentationDomain Generalization	CodeCode Available
When Neural Networks Fail to Generalize? A Model Sensitivity Perspective	Dec 1, 2022	Data AugmentationDomain Generalization	CodeCode Available
Synthetic Data Augmentation for Enhancing Harmful Algal Bloom Detection with Machine Learning	Mar 5, 2025	Data Augmentation	CodeCode Available
Understanding robustness and generalization of artificial neural networks through Fourier masks	Mar 16, 2022	Data Augmentation	CodeCode Available
Nonparametric Bayesian Lomax delegate racing for survival analysis with competing risks	Oct 19, 2018	Data AugmentationSurvival Analysis	CodeCode Available
A Byte Sequence is Worth an Image: CNN for File Fragment Classification Using Bit Shift and n-Gram Embeddings	Apr 14, 2023	Data Augmentation	CodeCode Available
SegAugment: Maximizing the Utility of Speech Translation Data with Segmentation-based Augmentations	Dec 19, 2022	Data AugmentationSegmentation	CodeCode Available
Variational Autoencoder with Disentanglement Priors for Low-Resource Task-Specific Natural Language Generation	Feb 27, 2022	Data AugmentationDisentanglement	CodeCode Available
UoR-NCL at SemEval-2025 Task 1: Using Generative LLMs and CLIP Models for Multilingual Multimodal Idiomaticity Representation	Feb 28, 2025	Contrastive LearningData Augmentation	CodeCode Available
GraphLearner: Graph Node Clustering with Fully Learnable Augmentation	Dec 7, 2022	AttributeClustering	CodeCode Available
Segmentation Consistency Training: Out-of-Distribution Generalization for Medical Image Segmentation	May 30, 2022	Data AugmentationImage Segmentation	CodeCode Available
Nordic Vehicle Dataset (NVD): Performance of vehicle detectors using newly captured NVD from UAV in different snowy weather conditions	Apr 27, 2023	Data Augmentationobject-detection	CodeCode Available
Normal-bundle Bootstrap	Jul 27, 2020	Data Augmentation	CodeCode Available
Segmentation of Hemorrhagic Areas in Human Brain from CT Scan Images	Apr 24, 2023	Computed Tomography (CT)Data Augmentation	CodeCode Available
Towards More Equitable Question Answering Systems: How Much More Data Do You Need?	May 28, 2021	Cross-Lingual TransferData Augmentation	CodeCode Available
Towards More Sample Efficiency in Reinforcement Learning with Data Augmentation	Oct 19, 2019	Data AugmentationDeep Reinforcement Learning	CodeCode Available
Nostra Domina at EvaLatin 2024: Improving Latin Polarity Detection through Data Augmentation	Apr 11, 2024	Data Augmentation	CodeCode Available

Show:10 25 50

← PrevPage 159 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified