Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 8378 papers

Title	Date	Tasks	Status	Hype	Score
BSUV-Net: A Fully-Convolutional Neural Network forBackground Subtraction of Unseen Videos	Jan 14, 2020	Data AugmentationObject Tracking	CodeCode Available	1	5
Anatomical Data Augmentation via Fluid-based Image Registration	Jul 5, 2020	Data AugmentationImage Augmentation	CodeCode Available	1	5
Breaking the Representation Bottleneck of Chinese Characters: Neural Machine Translation with Stroke Sequence Modeling	Nov 23, 2022	Data AugmentationMachine Translation	CodeCode Available	1	5
Boundary thickness and robustness in learning models	Jul 9, 2020	Adversarial DefenseData Augmentation	CodeCode Available	1	5
Analysis of skin lesion images with deep learning	Jan 11, 2021	ClassificationData Augmentation	CodeCode Available	1	5
Brain Tumor Segmentation and Radiomics Survival Prediction: Contribution to the BRATS 2017 Challenge	Feb 28, 2018	Brain Tumor SegmentationData Augmentation	CodeCode Available	1	5
C2C-GenDA: Cluster-to-Cluster Generation for Data Augmentation of Slot Filling	Dec 13, 2020	Data AugmentationDiversity	CodeCode Available	1	5
Adaptive Graph Contrastive Learning for Recommendation	May 18, 2023	Collaborative FilteringContrastive Learning	CodeCode Available	1	5
Bootstrapping Relation Extractors using Syntactic Search by Examples	Feb 9, 2021	Data AugmentationRelation	CodeCode Available	1	5
AMR-DA: Data Augmentation by Abstract Meaning Representation	May 1, 2022	Abstract Meaning RepresentationData Augmentation	CodeCode Available	1	5
A Multi-dimensional Deep Structured State Space Approach to Speech Enhancement Using Small-footprint Models	Jun 1, 2023	Data AugmentationSpeech Enhancement	CodeCode Available	1	5
BOOTPLACE: Bootstrapped Object Placement with Detection Transformers	Mar 27, 2025	Data AugmentationObject	CodeCode Available	1	5
Bootstrap Your Object Detector via Mixed Training	Nov 4, 2021	Data AugmentationMissing Labels	CodeCode Available	1	5
An Accurate Car Counting in Aerial Images Based on Convolutional Neural Networks	Jul 13, 2021	Data AugmentationObject Counting	CodeCode Available	1	5
An augmentation strategy to mimic multi-scanner variability in MRI	Mar 23, 2021	Data Augmentation	CodeCode Available	1	5
Boosted Neural Decoders: Achieving Extreme Reliability of LDPC Codes for 6G Networks	May 22, 2024	Data AugmentationDecoder	CodeCode Available	1	5
A Cartesian Encoding Graph Neural Network for Crystal Structures Property Prediction: Application to Thermal Ellipsoid Estimation	Jan 30, 2025	ADP PredictionBand Gap	CodeCode Available	1	5
Analyzing Overfitting under Class Imbalance in Neural Networks for Image Segmentation	Feb 20, 2021	Data AugmentationImage Segmentation	CodeCode Available	1	5
Amharic LLaMA and LLaVA: Multimodal LLMs for Low Resource Languages	Mar 11, 2024	BenchmarkingData Augmentation	CodeCode Available	1	5
An Analysis of Simple Data Augmentation for Named Entity Recognition	Oct 22, 2020	Data Augmentationnamed-entity-recognition	CodeCode Available	1	5
An Asymptotically Optimal Multi-Armed Bandit Algorithm and Hyperparameter Optimization	Jul 11, 2020	Bayesian OptimizationData Augmentation	CodeCode Available	1	5
Break-It-Fix-It: Unsupervised Learning for Program Repair	Jun 11, 2021	C++ codeCode Repair	CodeCode Available	1	5
Eliminate Deviation with Deviation for Data Augmentation and a General Multi-modal Data Learning Method	Jan 21, 2021	Adversarial DefenseData Augmentation	CodeCode Available	1	5
Anchor-free Small-scale Multispectral Pedestrian Detection	Aug 19, 2020	Autonomous DrivingData Augmentation	CodeCode Available	1	5
An Effective and Robust Detector for Logo Detection	Aug 1, 2021	Data Augmentation	CodeCode Available	1	5
ADASR: An Adversarial Auto-Augmentation Framework for Hyperspectral and Multispectral Data Fusion	Oct 11, 2023	Data AugmentationDiversity	CodeCode Available	1	5
An Efficient and Scalable Deep Learning Approach for Road Damage Detection	Nov 18, 2020	Data AugmentationImage Augmentation	CodeCode Available	1	5
An Empirical Study of CLIP for Text-based Person Search	Aug 19, 2023	Cross-Modal RetrievalData Augmentation	CodeCode Available	1	5
scSSL-Bench: Benchmarking Self-Supervised Learning for Single-Cell Data	Jun 10, 2025	BenchmarkingData Augmentation	CodeCode Available	1	5
CALDA: Improving Multi-Source Time Series Domain Adaptation with Contrastive Adversarial Learning	Sep 30, 2021	Activity RecognitionContrastive Learning	CodeCode Available	1	5
An Empirical Survey of the Effectiveness of Debiasing Techniques for Pre-trained Language Models	Oct 16, 2021	counterfactualData Augmentation	CodeCode Available	1	5
An Empirical Survey of Data Augmentation for Time Series Classification with Neural Networks	Jul 31, 2020	Data AugmentationGeneral Classification	CodeCode Available	1	5
Amplitude-Phase Recombination: Rethinking Robustness of Convolutional Neural Networks in Frequency Domain	Aug 19, 2021	Adversarial AttackData Augmentation	CodeCode Available	1	5
An Investigation of End-to-End Models for Robust Speech Recognition	Feb 11, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1	5
Enhancing Recipe Retrieval with Foundation Models: A Data Augmentation Perspective	Dec 8, 2023	Cross-Modal RetrievalData Augmentation	CodeCode Available	1	5
CAR-MFL: Cross-Modal Augmentation by Retrieval for Multimodal Federated Learning with Missing Modalities	Jul 11, 2024	Data AugmentationFederated Learning	CodeCode Available	1	5
Cascaded deep monocular 3D human pose estimation with evolutionary training data	Jun 14, 2020	3D Human Pose EstimationData Augmentation	CodeCode Available	1	5
Causal Action Influence Aware Counterfactual Data Augmentation	May 29, 2024	counterfactualCounterfactual Reasoning	CodeCode Available	1	5
3D Common Corruptions and Data Augmentation	Mar 2, 2022	BenchmarkingData Augmentation	CodeCode Available	1	5
AnnoCTR: A Dataset for Detecting and Linking Entities, Tactics, and Techniques in Cyber Threat Reports	Apr 11, 2024	Data Augmentation	CodeCode Available	1	5
Overcoming challenges in leveraging GANs for few-shot data augmentation	Mar 30, 2022	ClassificationData Augmentation	CodeCode Available	1	5
Chest X-Ray Analysis of Tuberculosis by Deep Learning with Segmentation and Augmentation	Mar 3, 2018	Data AugmentationSegmentation	CodeCode Available	1	5
A Novel Geo-Localization Method for UAV and Satellite Images Using Cross-View Consistent Attention	Sep 23, 2023	BlockingData Augmentation	CodeCode Available	1	5
A parallel corpus of Python functions and documentation strings for automated code documentation and code generation	Jul 7, 2017	Code GenerationData Augmentation	CodeCode Available	1	5
Unsupervised Sketch-to-Photo Synthesis	Sep 18, 2019	ColorizationData Augmentation	CodeCode Available	1	5
AnswerSumm: A Manually-Curated Dataset and Pipeline for Answer Summarization	Nov 11, 2021	Community Question AnsweringData Augmentation	CodeCode Available	1	5
3D Copy-Paste: Physically Plausible Object Insertion for Monocular 3D Detection	Dec 8, 2023	3D Object DetectionData Augmentation	CodeCode Available	1	5
A pipeline for fair comparison of graph neural networks in node classification tasks	Dec 19, 2020	Data AugmentationGeneral Classification	CodeCode Available	1	5
APBench: A Unified Benchmark for Availability Poisoning Attacks and Defenses	Aug 7, 2023	Data Augmentation	CodeCode Available	1	5
DiffAug: Enhance Unsupervised Contrastive Learning with Domain-Knowledge-Free Diffusion-based Data Augmentation	Sep 10, 2023	Contrastive LearningData Augmentation	CodeCode Available	1	5

Show:10 25 50

← PrevPage 5 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified