Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 326–350 of 8378 papers

Title	Date	Tasks	Status	Hype
An evaluation framework for synthetic data generation models	Apr 13, 2024	Data AugmentationSynthetic Data Generation	CodeCode Available	1
FashionFail: Addressing Failure Cases in Fashion Object Detection and Segmentation	Apr 12, 2024	Data AugmentationObject Detection	CodeCode Available	1
AnnoCTR: A Dataset for Detecting and Linking Entities, Tactics, and Techniques in Cyber Threat Reports	Apr 11, 2024	Data Augmentation	CodeCode Available	1
ORacle: Large Vision-Language Models for Knowledge-Guided Holistic OR Domain Modeling	Apr 10, 2024	Data AugmentationGraph Generation	CodeCode Available	1
FPL+: Filtered Pseudo Label-based Unsupervised Cross-Modality Adaptation for 3D Medical Image Segmentation	Apr 7, 2024	Data AugmentationDomain Adaptation	CodeCode Available	1
PairAug: What Can Augmented Image-Text Pairs Do for Radiology?	Apr 7, 2024	Data Augmentationimage-classification	CodeCode Available	1
JUICER: Data-Efficient Imitation Learning for Robotic Assembly	Apr 4, 2024	Data AugmentationImitation Learning	CodeCode Available	1
LiteNeXt: A Novel Lightweight ConvMixer-based Model with Self-embedding Representation Parallel for Medical Image Segmentation	Apr 4, 2024	Data AugmentationDecoder	CodeCode Available	1
ContrastCAD: Contrastive Learning-based Representation Learning for Computer-Aided Design Models	Apr 2, 2024	Contrastive LearningData Augmentation	CodeCode Available	1
Source-Aware Training Enables Knowledge Attribution in Language Models	Apr 1, 2024	Data Augmentation	CodeCode Available	1
Enhance Image Classification via Inter-Class Image Mixup with Diffusion Model	Mar 28, 2024	Data AugmentationDiversity	CodeCode Available	1
GeNet: A Graph Neural Network-based Anti-noise Task-Oriented Semantic Communication Paradigm	Mar 27, 2024	Data AugmentationDecoder	CodeCode Available	1
MMIDR: Teaching Large Language Model to Interpret Multimodal Misinformation via Knowledge Distillation	Mar 21, 2024	Data AugmentationDecision Making	CodeCode Available	1
RigorLLM: Resilient Guardrails for Large Language Models against Undesired Content	Mar 19, 2024	Data Augmentation	CodeCode Available	1
TexTile: A Differentiable Metric for Texture Tileability	Mar 19, 2024	Data AugmentationMetric Learning	CodeCode Available	1
DreamDA: Generative Data Augmentation with Diffusion Models	Mar 19, 2024	Data AugmentationDiversity	CodeCode Available	1
Do Generated Data Always Help Contrastive Learning?	Mar 19, 2024	Contrastive LearningData Augmentation	CodeCode Available	1
SETA: Semantic-Aware Token Augmentation for Domain Generalization	Mar 18, 2024	Data AugmentationDomain Generalization	CodeCode Available	1
GenView: Enhancing View Quality with Pretrained Generative Model for Self-Supervised Learning	Mar 18, 2024	Contrastive LearningData Augmentation	CodeCode Available	1
Scaling Data Diversity for Fine-Tuning Language Models in Human Alignment	Mar 17, 2024	Data AugmentationDiversity	CodeCode Available	1
Is Contrastive Learning Necessary? A Study of Data Augmentation vs Contrastive Learning in Sequential Recommendation	Mar 17, 2024	Contrastive LearningData Augmentation	CodeCode Available	1
YOLOv9 for Fracture Detection in Pediatric Wrist Trauma X-ray Images	Mar 17, 2024	Data AugmentationFracture detection	CodeCode Available	1
SF(DA)^2: Source-free Domain Adaptation Through the Lens of Data Augmentation	Mar 16, 2024	Data AugmentationDisentanglement	CodeCode Available	1
EquiAV: Leveraging Equivariance for Audio-Visual Contrastive Learning	Mar 14, 2024	Audio Classificationaudio-visual learning	CodeCode Available	1
EventRPG: Event Data Augmentation with Relevance Propagation Guidance	Mar 14, 2024	Action RecognitionData Augmentation	CodeCode Available	1

Show:10 25 50

← PrevPage 14 of 336Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified