Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 8378 papers

Title	Date	Tasks	Status	Hype
Addressing Concept Shift in Online Time Series Forecasting: Detect-then-Adapt	Mar 22, 2024	Data AugmentationTime Series	CodeCode Available	2
BooW-VTON: Boosting In-the-Wild Virtual Try-On via Mask-Free Pseudo Data Training	Aug 12, 2024	Data AugmentationVirtual Try-on	CodeCode Available	2
GAN-Supervised Dense Visual Alignment	Dec 9, 2021	Data AugmentationDense Pixel Correspondence Estimation	CodeCode Available	2
BOP Challenge 2020 on 6D Object Localization	Sep 15, 2020	6D Pose Estimation6D Pose Estimation using RGB	CodeCode Available	2
CodeS: Towards Building Open-source Language Models for Text-to-SQL	Feb 26, 2024	Data AugmentationDiagnostic	CodeCode Available	2
GraphGPT: Graph Instruction Tuning for Large Language Models	Oct 19, 2023	Data AugmentationGraph Learning	CodeCode Available	2
Identity Decoupling for Multi-Subject Personalization of Text-to-Image Models	Apr 5, 2024	Data Augmentation	CodeCode Available	2
Decoupling Representation Learning from Reinforcement Learning	Sep 14, 2020	Data AugmentationDeep Reinforcement Learning	CodeCode Available	2
Intriguing Properties of Contrastive Losses	Nov 5, 2020	Contrastive LearningData Augmentation	CodeCode Available	2
LLMEmb: Large Language Model Can Be a Good Embedding Generator for Sequential Recommendation	Sep 30, 2024	AttributeCollaborative Filtering	CodeCode Available	2
Learn Beyond The Answer: Training Language Models with Reflection for Mathematical Reasoning	Jun 17, 2024	Data AugmentationMathematical Reasoning	CodeCode Available	2
LibFewShot: A Comprehensive Library for Few-shot Learning	Sep 10, 2021	Data AugmentationFew-Shot Image Classification	CodeCode Available	2
LLM2LLM: Boosting LLMs with Novel Iterative Data Enhancement	Mar 22, 2024	Data AugmentationGSM8K	CodeCode Available	2
Many-MobileNet: Multi-Model Augmentation for Robust Retinal Disease Classification	Dec 3, 2024	Computational EfficiencyData Augmentation	CodeCode Available	2
Mind the Domain Gap: a Systematic Analysis on Bioacoustic Sound Event Detection	Mar 27, 2024	Data AugmentationDomain Adaptation	CodeCode Available	2
MolNexTR: A Generalized Deep Learning Model for Molecular Image Recognition	Mar 6, 2024	Data AugmentationDeep Learning	CodeCode Available	2
Multi-Modal Self-Supervised Learning for Recommendation	Feb 21, 2023	Contrastive LearningData Augmentation	CodeCode Available	2
SECOND: Sparsely Embedded Convolutional Detection	Oct 6, 2018	3D Object DetectionAutonomous Driving	CodeCode Available	2
Navigating the Shadows: Unveiling Effective Disturbances for Modern AI Content Detectors	Jun 13, 2024	Data AugmentationText Detection	CodeCode Available	2
BFANet: Revisiting 3D Semantic Segmentation with Boundary Feature Analysis	Mar 16, 2025	3D Semantic SegmentationData Augmentation	CodeCode Available	1
Beyond OOD State Actions: Supported Cross-Domain Offline Reinforcement Learning	Jun 22, 2023	Data AugmentationOffline RL	CodeCode Available	1
Bidirectional Generative Framework for Cross-domain Aspect-based Sentiment Analysis	May 16, 2023	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available	1
BEVDiffLoc: End-to-End LiDAR Global Localization in BEV View based on Diffusion Model	Mar 14, 2025	Autonomous DrivingData Augmentation	CodeCode Available	1
3D Copy-Paste: Physically Plausible Object Insertion for Monocular 3D Detection	Dec 8, 2023	3D Object DetectionData Augmentation	CodeCode Available	1
Exploring Discontinuity for Video Frame Interpolation	Feb 15, 2022	Data AugmentationVideo Frame Interpolation	CodeCode Available	1
Bi-level Learning of Task-Specific Decoders for Joint Registration and One-Shot Medical Image Segmentation	Jan 1, 2024	Data AugmentationImage Segmentation	CodeCode Available	1
Better Robustness by More Coverage: Adversarial Training with Mixup Augmentation for Robust Fine-tuning	Dec 31, 2020	Adversarial RobustnessData Augmentation	CodeCode Available	1
Better plain ViT baselines for ImageNet-1k	May 3, 2022	Data AugmentationImage Classification	CodeCode Available	1
Better Robustness by More Coverage: Adversarial and Mixup Data Augmentation for Robust Finetuning	Aug 1, 2021	Data Augmentation	CodeCode Available	1
Behavior Injection: Preparing Language Models for Reinforcement Learning	May 25, 2025	Data Augmentationreinforcement-learning	CodeCode Available	1
3D Common Corruptions and Data Augmentation	Mar 2, 2022	BenchmarkingData Augmentation	CodeCode Available	1
BET: A Backtranslation Approach for Easy Data Augmentation in Transformer-based Paraphrase Identification Context	Sep 25, 2020	Data AugmentationMRPC	CodeCode Available	1
Bag of Tricks for Long-Tailed Visual Recognition with Deep Convolutional Neural Networks	May 19, 2021	Data AugmentationMeta-Learning	CodeCode Available	1
BAGAN: Data Augmentation with Balancing GAN	Mar 26, 2018	Data Augmentationimage-classification	CodeCode Available	1
Bayesian Adversarial Human Motion Synthesis	Jun 1, 2020	Bayesian InferenceData Augmentation	CodeCode Available	1
Background-Mixed Augmentation for Weakly Supervised Change Detection	Nov 21, 2022	Change DetectionData Augmentation	CodeCode Available	1
A Winning Hand: Compressing Deep Networks Can Improve Out-Of-Distribution Robustness	Jun 16, 2021	Data AugmentationModel Compression	CodeCode Available	1
Back to Basics: A Simple Recipe for Improving Out-of-Domain Retrieval in Dense Encoders	Nov 16, 2023	Data AugmentationDomain Generalization	CodeCode Available	1
Bayesian inference for logistic models using Polya-Gamma latent variables	May 2, 2012	Bayesian InferenceComputational Efficiency	CodeCode Available	1
AutoML Segmentation for 3D Medical Image Data: Contribution to the MSD Challenge 2018	May 20, 2020	3D Semantic SegmentationAutoML	CodeCode Available	1
AutoMix: Unveiling the Power of Mixup for Stronger Classifiers	Mar 24, 2021	ClassificationData Augmentation	CodeCode Available	1
PIGNet2: A Versatile Deep Learning-based Protein-Ligand Interaction Prediction Model for Binding Affinity Scoring and Virtual Screening	Jul 3, 2023	Data AugmentationDrug Discovery	CodeCode Available	1
Automatic Data Augmentation for 3D Medical Image Segmentation	Oct 7, 2020	Data AugmentationDiversity	CodeCode Available	1
Automatic Data Augmentation for Generalization in Reinforcement Learning	Dec 1, 2021	Data AugmentationDeep Reinforcement Learning	CodeCode Available	1
Automatic speaker verification spoofing and deepfake detection using wav2vec 2.0 and data augmentation	Feb 24, 2022	Audio Deepfake DetectionData Augmentation	CodeCode Available	1
BDANet: Multiscale Convolutional Neural Network with Cross-directional Attention for Building Damage Assessment from Satellite Images	May 16, 2021	2D Semantic SegmentationBuilding Damage Assessment	CodeCode Available	1
AutoDetect: Towards a Unified Framework for Automated Weakness Detection in Large Language Models	Jun 24, 2024	BenchmarkingData Augmentation	CodeCode Available	1
AutoDC: Automated data-centric processing	Nov 23, 2021	AutoMLData Augmentation	CodeCode Available	1
Automated Chest CT Image Segmentation of COVID-19 Lung Infection based on 3D U-Net	Jun 24, 2020	Data AugmentationImage Segmentation	CodeCode Available	1
A Cartesian Encoding Graph Neural Network for Crystal Structures Property Prediction: Application to Thermal Ellipsoid Estimation	Jan 30, 2025	ADP PredictionBand Gap	CodeCode Available	1

Show:10 25 50

← PrevPage 4 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified