Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 8378 papers

Title	Date	Tasks	Status	Hype	Score
CodeS: Towards Building Open-source Language Models for Text-to-SQL	Feb 26, 2024	Data AugmentationDiagnostic	CodeCode Available	2	5
ARoFace: Alignment Robustness to Improve Low-Quality Face Recognition	Jul 20, 2024	Data AugmentationFace Alignment	CodeCode Available	2	5
Generative Adversarial Network in Medical Imaging: A Review	Sep 19, 2018	Data AugmentationDomain Adaptation	CodeCode Available	2	5
BOP Challenge 2020 on 6D Object Localization	Sep 15, 2020	6D Pose Estimation6D Pose Estimation using RGB	CodeCode Available	2	5
BooW-VTON: Boosting In-the-Wild Virtual Try-On via Mask-Free Pseudo Data Training	Aug 12, 2024	Data AugmentationVirtual Try-on	CodeCode Available	2	5
BWFormer: Building Wireframe Reconstruction from Airborne LiDAR Point Cloud with Transformer	Jan 1, 2025	Data Augmentation	CodeCode Available	2	5
Improved Multi-Task Brain Tumour Segmentation with Synthetic Data Augmentation	Nov 7, 2024	Data AugmentationSynthetic Data Generation	CodeCode Available	2	5
Composed Multi-modal Retrieval: A Survey of Approaches and Applications	Mar 3, 2025	Cross-Modal RetrievalData Augmentation	CodeCode Available	2	5
A Survey on Data Augmentation in Large Model Era	Jan 27, 2024	Audio Signal ProcessingData Augmentation	CodeCode Available	2	5
EDA: Easy Data Augmentation Techniques for Boosting Performance on Text Classification Tasks	Jan 31, 2019	Data AugmentationGeneral Classification	CodeCode Available	2	5
A Survey of Data Augmentation Approaches for NLP	May 7, 2021	Data AugmentationSurvey	CodeCode Available	2	5
Learn Beyond The Answer: Training Language Models with Reflection for Mathematical Reasoning	Jun 17, 2024	Data AugmentationMathematical Reasoning	CodeCode Available	2	5
LLaMAX: Scaling Linguistic Horizons of LLM by Enhancing Translation Capabilities Beyond 100 Languages	Jul 8, 2024	Data AugmentationTranslation	CodeCode Available	2	5
LLM2LLM: Boosting LLMs with Novel Iterative Data Enhancement	Mar 22, 2024	Data AugmentationGSM8K	CodeCode Available	2	5
MindBridge: A Cross-Subject Brain Decoding Framework	Apr 11, 2024	Brain DecodingData Augmentation	CodeCode Available	2	5
Mind the Domain Gap: a Systematic Analysis on Bioacoustic Sound Event Detection	Mar 27, 2024	Data AugmentationDomain Adaptation	CodeCode Available	2	5
LLMEmb: Large Language Model Can Be a Good Embedding Generator for Sequential Recommendation	Sep 30, 2024	AttributeCollaborative Filtering	CodeCode Available	2	5
Multi-Modal Representation Learning for Molecular Property Prediction: Sequence, Graph, Geometry	Jan 7, 2024	Data AugmentationDrug Discovery	CodeCode Available	2	5
Searching for a Search Method: Benchmarking Search Algorithms for Generating NLP Adversarial Examples	Sep 9, 2020	Adversarial TextBenchmarking	CodeCode Available	2	5
BFANet: Revisiting 3D Semantic Segmentation with Boundary Feature Analysis	Mar 16, 2025	3D Semantic SegmentationData Augmentation	CodeCode Available	1	5
Beyond OOD State Actions: Supported Cross-Domain Offline Reinforcement Learning	Jun 22, 2023	Data AugmentationOffline RL	CodeCode Available	1	5
Bidirectional Generative Framework for Cross-domain Aspect-based Sentiment Analysis	May 16, 2023	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available	1	5
An Analysis of Simple Data Augmentation for Named Entity Recognition	Oct 22, 2020	Data Augmentationnamed-entity-recognition	CodeCode Available	1	5
3D Copy-Paste: Physically Plausible Object Insertion for Monocular 3D Detection	Dec 8, 2023	3D Object DetectionData Augmentation	CodeCode Available	1	5
An Asymptotically Optimal Multi-Armed Bandit Algorithm and Hyperparameter Optimization	Jul 11, 2020	Bayesian OptimizationData Augmentation	CodeCode Available	1	5
Bi-level Learning of Task-Specific Decoders for Joint Registration and One-Shot Medical Image Segmentation	Jan 1, 2024	Data AugmentationImage Segmentation	CodeCode Available	1	5
Analyzing Overfitting under Class Imbalance in Neural Networks for Image Segmentation	Feb 20, 2021	Data AugmentationImage Segmentation	CodeCode Available	1	5
BEVDiffLoc: End-to-End LiDAR Global Localization in BEV View based on Diffusion Model	Mar 14, 2025	Autonomous DrivingData Augmentation	CodeCode Available	1	5
Analysis of skin lesion images with deep learning	Jan 11, 2021	ClassificationData Augmentation	CodeCode Available	1	5
3D Common Corruptions and Data Augmentation	Mar 2, 2022	BenchmarkingData Augmentation	CodeCode Available	1	5
Anatomical Data Augmentation via Fluid-based Image Registration	Jul 5, 2020	Data AugmentationImage Augmentation	CodeCode Available	1	5
Exploring Discontinuity for Video Frame Interpolation	Feb 15, 2022	Data AugmentationVideo Frame Interpolation	CodeCode Available	1	5
An Accurate Car Counting in Aerial Images Based on Convolutional Neural Networks	Jul 13, 2021	Data AugmentationObject Counting	CodeCode Available	1	5
A Multi-dimensional Deep Structured State Space Approach to Speech Enhancement Using Small-footprint Models	Jun 1, 2023	Data AugmentationSpeech Enhancement	CodeCode Available	1	5
Better plain ViT baselines for ImageNet-1k	May 3, 2022	Data AugmentationImage Classification	CodeCode Available	1	5
Amplitude-Phase Recombination: Rethinking Robustness of Convolutional Neural Networks in Frequency Domain	Aug 19, 2021	Adversarial AttackData Augmentation	CodeCode Available	1	5
AMR-DA: Data Augmentation by Abstract Meaning Representation	May 1, 2022	Abstract Meaning RepresentationData Augmentation	CodeCode Available	1	5
BET: A Backtranslation Approach for Easy Data Augmentation in Transformer-based Paraphrase Identification Context	Sep 25, 2020	Data AugmentationMRPC	CodeCode Available	1	5
Better Robustness by More Coverage: Adversarial Training with Mixup Augmentation for Robust Fine-tuning	Dec 31, 2020	Adversarial RobustnessData Augmentation	CodeCode Available	1	5
Bayesian inference for logistic models using Polya-Gamma latent variables	May 2, 2012	Bayesian InferenceComputational Efficiency	CodeCode Available	1	5
Amharic LLaMA and LLaVA: Multimodal LLMs for Low Resource Languages	Mar 11, 2024	BenchmarkingData Augmentation	CodeCode Available	1	5
BDANet: Multiscale Convolutional Neural Network with Cross-directional Attention for Building Damage Assessment from Satellite Images	May 16, 2021	2D Semantic SegmentationBuilding Damage Assessment	CodeCode Available	1	5
Bag of Tricks for Long-Tailed Visual Recognition with Deep Convolutional Neural Networks	May 19, 2021	Data AugmentationMeta-Learning	CodeCode Available	1	5
Bayesian Adversarial Human Motion Synthesis	Jun 1, 2020	Bayesian InferenceData Augmentation	CodeCode Available	1	5
Behavior Injection: Preparing Language Models for Reinforcement Learning	May 25, 2025	Data Augmentationreinforcement-learning	CodeCode Available	1	5
Better Robustness by More Coverage: Adversarial and Mixup Data Augmentation for Robust Finetuning	Aug 1, 2021	Data Augmentation	CodeCode Available	1	5
A Locality-based Neural Solver for Optical Motion Capture	Sep 1, 2023	Data AugmentationGraph Neural Network	CodeCode Available	1	5
A Winning Hand: Compressing Deep Networks Can Improve Out-Of-Distribution Robustness	Jun 16, 2021	Data AugmentationModel Compression	CodeCode Available	1	5
A Cartesian Encoding Graph Neural Network for Crystal Structures Property Prediction: Application to Thermal Ellipsoid Estimation	Jan 30, 2025	ADP PredictionBand Gap	CodeCode Available	1	5
AlignMixup: Improving Representations By Interpolating Aligned Features	Mar 29, 2021	Data AugmentationRepresentation Learning	CodeCode Available	1	5

Show:10 25 50

← PrevPage 4 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified