Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1251–1300 of 8378 papers

Title	Date	Tasks	Status	Hype
Abstract Meaning Representation-Based Logic-Driven Data Augmentation for Logical Reasoning	May 21, 2023	Abstract Meaning RepresentationContrastive Learning	CodeCode Available	1
Controllable Data Augmentation for Few-Shot Text Mining with Chain-of-Thought Attribute Manipulation	Jul 14, 2023	Aspect-Based Sentiment AnalysisAttribute	CodeCode Available	1
Multi-Modal and Multi-Attribute Generation of Single Cells with CFGen	Jul 16, 2024	AttributeData Augmentation	CodeCode Available	1
Generating Syntactically Controlled Paraphrases without Using Annotated Parallel Pairs	Jan 26, 2021	Data AugmentationDecoder	CodeCode Available	1
Controllable Dialogue Simulation with In-Context Learning	Oct 9, 2022	Data AugmentationIn-Context Learning	CodeCode Available	1
Generative Adversarial Networks	Mar 1, 2022	Data AugmentationImage Generation	CodeCode Available	1
Generative Contrastive Graph Learning for Recommendation	Jul 11, 2023	Collaborative FilteringContrastive Learning	CodeCode Available	1
Generative Cross-Domain Data Augmentation for Aspect and Opinion Co-Extraction	Jul 1, 2022	Data AugmentationDomain Adaptation	CodeCode Available	1
Generative Dataset Distillation Based on Diffusion Model	Aug 16, 2024	Data AugmentationDataset Distillation	CodeCode Available	1
GeNet: A Graph Neural Network-based Anti-noise Task-Oriented Semantic Communication Paradigm	Mar 27, 2024	Data AugmentationDecoder	CodeCode Available	1
Genie: A Generator of Natural Language Semantic Parsers for Virtual Assistant Commands	Apr 18, 2019	Data AugmentationTranslation	CodeCode Available	1
GeNIe: Generative Hard Negative Images Through Diffusion	Dec 5, 2023	Data AugmentationImage Generation	CodeCode Available	1
3D U-Net: Learning Dense Volumetric Segmentation from Sparse Annotation	Jun 21, 2016	3D Instance SegmentationData Augmentation	CodeCode Available	1
Capturing complex hand movements and object interactions using machine learning-powered stretchable smart textile gloves	Oct 3, 2024	Data Augmentation	CodeCode Available	1
Boosted Neural Decoders: Achieving Extreme Reliability of LDPC Codes for 6G Networks	May 22, 2024	Data AugmentationDecoder	CodeCode Available	1
Geo-Tiles for Semantic Segmentation of Earth Observation Imagery	Jun 1, 2023	Data AugmentationEarth Observation	CodeCode Available	1
Global Pooling, More than Meets the Eye: Position Information is Encoded Channel-Wise in CNNs	Aug 17, 2021	Data AugmentationPosition	CodeCode Available	1
G-Mixup: Graph Data Augmentation for Graph Classification	Feb 15, 2022	ClassificationData Augmentation	CodeCode Available	1
GOLD: Improving Out-of-Scope Detection in Dialogues using Data Augmentation	Sep 7, 2021	Data Augmentation	CodeCode Available	1
GOOD-D: On Unsupervised Graph Out-Of-Distribution Detection	Nov 8, 2022	Contrastive LearningData Augmentation	CodeCode Available	1
Counterfactual Data Augmentation using Locally Factored Dynamics	Jul 6, 2020	counterfactualData Augmentation	CodeCode Available	1
ContrastCAD: Contrastive Learning-based Representation Learning for Computer-Aided Design Models	Apr 2, 2024	Contrastive LearningData Augmentation	CodeCode Available	1
Graph-level Representation Learning with Joint-Embedding Predictive Architectures	Sep 27, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
Graph Masked Autoencoder for Sequential Recommendation	May 8, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
An Investigation of End-to-End Models for Robust Speech Recognition	Feb 11, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Graph Transformer for Recommendation	Jun 4, 2023	Collaborative FilteringData Augmentation	CodeCode Available	1
GRLib: An Open-Source Hand Gesture Detection and Recognition Python Library	Oct 23, 2023	Data AugmentationGesture Recognition	CodeCode Available	1
Grounded Adaptation for Zero-shot Executable Semantic Parsing	Sep 16, 2020	Data AugmentationDialogue State Tracking	CodeCode Available	1
A Comprehensive Approach to Unsupervised Embedding Learning based on AND Algorithm	Feb 26, 2020	Data Augmentationimage-classification	CodeCode Available	1
CLARA: Multilingual Contrastive Learning for Audio Representation Acquisition	Oct 18, 2023	Audio ClassificationContrastive Learning	CodeCode Available	1
AnnoCTR: A Dataset for Detecting and Linking Entities, Tactics, and Techniques in Cyber Threat Reports	Apr 11, 2024	Data Augmentation	CodeCode Available	1
Harmonic Networks: Deep Translation and Rotation Equivariance	Dec 14, 2016	Data AugmentationRotated MNIST	CodeCode Available	1
MixRec: Heterogeneous Graph Collaborative Filtering	Dec 18, 2024	Collaborative FilteringContrastive Learning	CodeCode Available	1
HFL at SemEval-2022 Task 8: A Linguistics-inspired Regression Model with Data Augmentation for Multilingual News Similarity	Apr 11, 2022	Data Augmentation	CodeCode Available	1
Hierarchical Amortized Training for Memory-efficient High Resolution 3D GAN	Aug 5, 2020	Data AugmentationDomain Adaptation	CodeCode Available	1
Hierarchical Disentanglement-Alignment Network for Robust SAR Vehicle Recognition	Apr 7, 2023	Data AugmentationDisentanglement	CodeCode Available	1
Contrast and Classify: Training Robust VQA Models	Oct 13, 2020	Contrastive LearningData Augmentation	CodeCode Available	1
Highly Accurate FMRI ADHD Classification using time distributed multi modal 3D CNNs	May 24, 2022	ClassificationData Augmentation	CodeCode Available	1
HINER: Neural Representation for Hyperspectral Image	Jul 31, 2024	ClassificationData Augmentation	CodeCode Available	1
Histogram Matching Augmentation for Domain Adaptation with Application to Multi-Centre, Multi-Vendor and Multi-Disease Cardiac Image Segmentation	Dec 27, 2020	Data AugmentationDomain Adaptation	CodeCode Available	1
How Important is Importance Sampling for Deep Budgeted Training?	Oct 27, 2021	Data Augmentation	CodeCode Available	1
How to Select One Among All? An Extensive Empirical Study Towards the Robustness of Knowledge Distillation in Natural Language Understanding	Sep 13, 2021	Adversarial RobustnessAll	CodeCode Available	1
DiffAug: Enhance Unsupervised Contrastive Learning with Domain-Knowledge-Free Diffusion-based Data Augmentation	Sep 10, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
BOOTPLACE: Bootstrapped Object Placement with Detection Transformers	Mar 27, 2025	Data AugmentationObject	CodeCode Available	1
Causal Action Influence Aware Counterfactual Data Augmentation	May 29, 2024	counterfactualCounterfactual Reasoning	CodeCode Available	1
HybridAugment++: Unified Frequency Spectra Perturbations for Model Robustness	Jul 21, 2023	Adversarial RobustnessData Augmentation	CodeCode Available	1
HyperTab: Hypernetwork Approach for Deep Learning on Small Tabular Datasets	Apr 7, 2023	Data AugmentationDeep Learning	CodeCode Available	1
Bootstrapping Relation Extractors using Syntactic Search by Examples	Feb 9, 2021	Data AugmentationRelation	CodeCode Available	1
ID-Blau: Image Deblurring by Implicit Diffusion-based reBLurring AUgmentation	Dec 18, 2023	Data AugmentationDeblurring	CodeCode Available	1
Contrastive Code Representation Learning	Jul 9, 2020	Clone DetectionContrastive Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 26 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified