Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 451–500 of 8378 papers

Title	Date	Tasks	Status	Hype	Score
Diffusion Curriculum: Synthetic-to-Real Generative Curriculum Learning via Image-Guided Diffusion	Oct 17, 2024	Data AugmentationImage Generation	CodeCode Available	1	5
Copula-based synthetic data augmentation for machine-learning emulators	Dec 16, 2020	BIG-bench Machine LearningData Augmentation	CodeCode Available	1	5
ADASR: An Adversarial Auto-Augmentation Framework for Hyperspectral and Multispectral Data Fusion	Oct 11, 2023	Data AugmentationDiversity	CodeCode Available	1	5
DiGA: Distil to Generalize and then Adapt for Domain Adaptive Semantic Segmentation	Apr 5, 2023	Data AugmentationKnowledge Distillation	CodeCode Available	1	5
Directional Graph Networks	Oct 6, 2020	Data AugmentationGraph Classification	CodeCode Available	1	5
DISCO: Distilling Counterfactuals with Large Language Models	Dec 20, 2022	counterfactualData Augmentation	CodeCode Available	1	5
BET: A Backtranslation Approach for Easy Data Augmentation in Transformer-based Paraphrase Identification Context	Sep 25, 2020	Data AugmentationMRPC	CodeCode Available	1	5
Discriminative Feature Alignment: Improving Transferability of Unsupervised Domain Adaptation by Gaussian-guided Latent Alignment	Jun 23, 2020	Data AugmentationDecoder	CodeCode Available	1	5
Better plain ViT baselines for ImageNet-1k	May 3, 2022	Data AugmentationImage Classification	CodeCode Available	1	5
A Light Recipe to Train Robust Vision Transformers	Sep 15, 2022	Adversarial RobustnessData Augmentation	CodeCode Available	1	5
Counterfactual Data Augmentation for Neural Machine Translation	Jun 1, 2021	counterfactualData Augmentation	CodeCode Available	1	5
Better Robustness by More Coverage: Adversarial and Mixup Data Augmentation for Robust Finetuning	Aug 1, 2021	Data Augmentation	CodeCode Available	1	5
Exploring Discontinuity for Video Frame Interpolation	Feb 15, 2022	Data AugmentationVideo Frame Interpolation	CodeCode Available	1	5
Beyond OOD State Actions: Supported Cross-Domain Offline Reinforcement Learning	Jun 22, 2023	Data AugmentationOffline RL	CodeCode Available	1	5
Flexible Distribution Alignment: Towards Long-tailed Semi-supervised Learning with Proper Calibration	Jun 7, 2023	Data Augmentation	CodeCode Available	1	5
Distilling Model Failures as Directions in Latent Space	Jun 29, 2022	Data Augmentation	CodeCode Available	1	5
Cross-Domain Feature Augmentation for Domain Generalization	May 14, 2024	Data AugmentationDiversity	CodeCode Available	1	5
BFANet: Revisiting 3D Semantic Segmentation with Boundary Feature Analysis	Mar 16, 2025	3D Semantic SegmentationData Augmentation	CodeCode Available	1	5
AlignMixup: Improving Representations By Interpolating Aligned Features	Mar 29, 2021	Data AugmentationRepresentation Learning	CodeCode Available	1	5
Bidirectional Generative Framework for Cross-domain Aspect-based Sentiment Analysis	May 16, 2023	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available	1	5
CutPaste: Self-Supervised Learning for Anomaly Detection and Localization	Apr 8, 2021	Anomaly ClassificationAnomaly Detection	CodeCode Available	1	5
Data Augmentation of Wearable Sensor Data for Parkinson's Disease Monitoring using Convolutional Neural Networks	Jun 2, 2017	ClassificationData Augmentation	CodeCode Available	1	5
DLME: Deep Local-flatness Manifold Embedding	Jul 7, 2022	Contrastive LearningData Augmentation	CodeCode Available	1	5
DocXClassifier: High Performance Explainable Deep Network for Document Image Classification	Mar 17, 2022	ClassificationData Augmentation	CodeCode Available	1	5
A Locality-based Neural Solver for Optical Motion Capture	Sep 1, 2023	Data AugmentationGraph Neural Network	CodeCode Available	1	5
Domain Adaptive 3D Pose Augmentation for In-the-wild Human Mesh Recovery	Jun 21, 2022	Data AugmentationDomain Adaptation	CodeCode Available	1	5
Boosted Neural Decoders: Achieving Extreme Reliability of LDPC Codes for 6G Networks	May 22, 2024	Data AugmentationDecoder	CodeCode Available	1	5
Domain Generalization using Causal Matching	Jun 12, 2020	Data AugmentationDomain Generalization	CodeCode Available	1	5
3D Common Corruptions and Data Augmentation	Mar 2, 2022	BenchmarkingData Augmentation	CodeCode Available	1	5
Alternate Diverse Teaching for Semi-supervised Medical Image Segmentation	Nov 29, 2023	Data AugmentationImage Segmentation	CodeCode Available	1	5
BOOTPLACE: Bootstrapped Object Placement with Detection Transformers	Mar 27, 2025	Data AugmentationObject	CodeCode Available	1	5
AltFreezing for More General Video Face Forgery Detection	Jul 17, 2023	Data Augmentation	CodeCode Available	1	5
CAiRE in DialDoc21: Data Augmentation for Information-Seeking Dialogue System	Jun 7, 2021	Data AugmentationResponse Generation	CodeCode Available	1	5
DrugCLIP: Contrastive Protein-Molecule Representation Learning for Virtual Screening	Oct 10, 2023	Contrastive LearningData Augmentation	CodeCode Available	1	5
Controllable Data Augmentation Through Deep Relighting	Oct 26, 2021	Data AugmentationDecoder	CodeCode Available	1	5
A Regularization-Guided Equivariant Approach for Image Restoration	May 26, 2025	Data AugmentationImage Restoration	CodeCode Available	1	5
Controllable Dialogue Simulation with In-Context Learning	Oct 9, 2022	Data AugmentationIn-Context Learning	CodeCode Available	1	5
Dual Contrastive Learning: Text Classification via Label-Aware Data Augmentation	Jan 21, 2022	ClassificationContrastive Learning	CodeCode Available	1	5
Control, Generate, Augment: A Scalable Framework for Multi-Attribute Text Generation	Apr 30, 2020	AttributeData Augmentation	CodeCode Available	1	5
3D U-Net: Learning Dense Volumetric Segmentation from Sparse Annotation	Jun 21, 2016	3D Instance SegmentationData Augmentation	CodeCode Available	1	5
Controllable 3D Face Generation with Conditional Style Code Diffusion	Dec 21, 2023	Data AugmentationFace Generation	CodeCode Available	1	5
ECG arrhythmia classification using a 2-D convolutional neural network	Apr 18, 2018	Arrhythmia DetectionData Augmentation	CodeCode Available	1	5
Breaking the Representation Bottleneck of Chinese Characters: Neural Machine Translation with Stroke Sequence Modeling	Nov 23, 2022	Data AugmentationMachine Translation	CodeCode Available	1	5
Break-It-Fix-It: Unsupervised Learning for Program Repair	Jun 11, 2021	C++ codeCode Repair	CodeCode Available	1	5
3D Copy-Paste: Physically Plausible Object Insertion for Monocular 3D Detection	Dec 8, 2023	3D Object DetectionData Augmentation	CodeCode Available	1	5
Amharic LLaMA and LLaVA: Multimodal LLMs for Low Resource Languages	Mar 11, 2024	BenchmarkingData Augmentation	CodeCode Available	1	5
CADTransformer: Panoptic Symbol Spotting Transformer for CAD Drawings	Jan 1, 2022	Data Augmentation	CodeCode Available	1	5
EEG-Inception: An Accurate and Robust End-to-End Neural Network for EEG-based Motor Imagery Classification	Jan 24, 2021	Brain Computer InterfaceClassification	CodeCode Available	1	5
CONVERT:Contrastive Graph Clustering with Reliable Augmentation	Aug 17, 2023	ClusteringContrastive Learning	CodeCode Available	1	5
A real-time and high-precision method for small traffic-signs recognition	Sep 25, 2021	Data Augmentationobject-detection	CodeCode Available	1	5

Show:10 25 50

← PrevPage 10 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified