Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 776–800 of 8378 papers

Title	Date	Tasks	Status	Hype
Improving speaker verification robustness with synthetic emotional utterances	Nov 30, 2024	Data AugmentationSpeaker Verification	—Unverified	0
BGM: Background Mixup for X-ray Prohibited Items Detection	Nov 30, 2024	Data AugmentationImage Augmentation	—Unverified	0
Improving the performance of weak supervision searches using data augmentation	Nov 29, 2024	Data AugmentationDiversity	—Unverified	0
T2Vid: Translating Long Text into Multi-Image is the Catalyst for Video-LLMs	Nov 29, 2024	Data AugmentationDiversity	CodeCode Available	1
Topology-Preserving Scaling in Data Augmentation	Nov 29, 2024	Data Augmentation	—Unverified	0
Towards Santali Linguistic Inclusion: Building the First Santali-to-English Translation Model using mT5 Transformer and Data Augmentation	Nov 29, 2024	Data AugmentationMachine Translation	—Unverified	0
Reverse Thinking Makes LLMs Stronger Reasoners	Nov 29, 2024	Data AugmentationKnowledge Distillation	—Unverified	0
CantorNet: A Sandbox for Testing Geometrical and Topological Complexity Measures	Nov 29, 2024	Data Augmentation	—Unverified	0
MaskRIS: Semantic Distortion-aware Data Augmentation for Referring Image Segmentation	Nov 28, 2024	Data AugmentationImage Segmentation	CodeCode Available	1
Data Augmentation with Diffusion Models for Colon Polyp Localization on the Low Data Regime: How much real data is enough?	Nov 28, 2024	Data AugmentationDeep Learning	—Unverified	0
UrbanCAD: Towards Highly Controllable and Photorealistic 3D Vehicles for Urban Scene Simulation	Nov 28, 2024	3DGSAutonomous Driving	—Unverified	0
Dual-Level Boost Network for Long-Tail Prohibited Items Detection in X-ray Security Inspection	Nov 27, 2024	Data Augmentation	—Unverified	0
Enhancing weed detection performance by means of GenAI-based image augmentation	Nov 27, 2024	Data AugmentationDiversity	—Unverified	0
Training and Evaluating Language Models with Template-based Data Generation	Nov 27, 2024	Data AugmentationMath	CodeCode Available	1
Thai Financial Domain Adaptation of THaLLE -- Technical Report	Nov 27, 2024	Data AugmentationDomain Adaptation	—Unverified	0
Synthetic ECG Generation for Data Augmentation and Transfer Learning in Arrhythmia Classification	Nov 27, 2024	Data AugmentationRhythm	—Unverified	0
Breast Tumor Classification Using EfficientNet Deep Learning Model	Nov 26, 2024	Binary ClassificationCancer Classification	CodeCode Available	0
Task Progressive Curriculum Learning for Robust Visual Question Answering	Nov 26, 2024	Data AugmentationEnsemble Learning	—Unverified	0
Scaling nnU-Net for CBCT Segmentation	Nov 26, 2024	Data Augmentation	—Unverified	0
Semantic Data Augmentation for Long-tailed Facial Expression Recognition	Nov 26, 2024	Data AugmentationFacial Expression Recognition	—Unverified	0
RoCoDA: Counterfactual Data Augmentation for Data-Efficient Robot Learning from Demonstrations	Nov 25, 2024	counterfactualData Augmentation	—Unverified	0
SynDiff-AD: Improving Semantic Segmentation and End-to-End Autonomous Driving with Synthetic Data from Latent Diffusion Models	Nov 25, 2024	Autonomous DrivingData Augmentation	—Unverified	0
J-CaPA : Joint Channel and Pyramid Attention Improves Medical Image Segmentation	Nov 25, 2024	Data AugmentationImage Segmentation	—Unverified	0
Enhancing Few-Shot Learning with Integrated Data and GAN Model Approaches	Nov 25, 2024	Data AugmentationDrug Discovery	—Unverified	0
Unsupervised Event Outlier Detection in Continuous Time	Nov 25, 2024	Anomaly DetectionData Augmentation	—Unverified	0

Show:10 25 50

← PrevPage 32 of 336Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified