Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 8378 papers

Title	Date	Tasks	Status	Hype
Diversify Your Vision Datasets with Automatic Diffusion-Based Augmentation	May 25, 2023	Data AugmentationDiversity	CodeCode Available	1
Training on Thin Air: Improve Image Classification with Generated Data	May 24, 2023	Data AugmentationFew-Shot Learning	CodeCode Available	1
Interactive Data Synthesis for Systematic Vision Adaptation via LLMs-AIGCs Collaboration	May 22, 2023	Data AugmentationImage Generation	CodeCode Available	1
Tied-Augment: Controlling Representation Similarity Improves Data Augmentation	May 22, 2023	Data Augmentation	CodeCode Available	1
PiVe: Prompting with Iterative Verification Improving Graph-based Generative Capability of LLMs	May 21, 2023	Data AugmentationGraph Generation	CodeCode Available	1
Abstract Meaning Representation-Based Logic-Driven Data Augmentation for Logical Reasoning	May 21, 2023	Abstract Meaning RepresentationContrastive Learning	CodeCode Available	1
Adaptive Graph Contrastive Learning for Recommendation	May 18, 2023	Collaborative FilteringContrastive Learning	CodeCode Available	1
Cross-modality Data Augmentation for End-to-End Sign Language Translation	May 18, 2023	Data AugmentationKnowledge Distillation	CodeCode Available	1
Making More of Little Data: Improving Low-Resource Automatic Speech Recognition Using Data Augmentation	May 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
Rethinking Data Augmentation for Tabular Data in Deep Learning	May 17, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
Bidirectional Generative Framework for Cross-domain Aspect-based Sentiment Analysis	May 16, 2023	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available	1
Learning Better Contrastive View from Radiologist's Gaze	May 15, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
DAC-MR: Data Augmentation Consistency Based Meta-Regularization for Meta-Learning	May 13, 2023	Data AugmentationMeta-Learning	CodeCode Available	1
Target-Side Augmentation for Document-Level Machine Translation	May 8, 2023	Data AugmentationDocument Level Machine Translation	CodeCode Available	1
Graph Masked Autoencoder for Sequential Recommendation	May 8, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
Semantic-aware Generation of Multi-view Portrait Drawings	May 4, 2023	3D-Aware Image SynthesisData Augmentation	CodeCode Available	1
Improving Contrastive Learning of Sentence Embeddings from AI Feedback	May 3, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
The Training Process of Many Deep Networks Explores the Same Low-Dimensional Manifold	May 2, 2023	Data Augmentation	CodeCode Available	1
Part Aware Contrastive Learning for Self-Supervised Action Recognition	May 1, 2023	Action RecognitionContrastive Learning	CodeCode Available	1
Generating images of rare concepts using pre-trained diffusion models	Apr 27, 2023	Data AugmentationDiversity	CodeCode Available	1
The Parrot Dilemma: Human-Labeled vs. LLM-augmented Data in Classification Tasks	Apr 26, 2023	Data AugmentationLanguage Modelling	CodeCode Available	1
Learning to Predict Navigational Patterns from Partial Observations	Apr 26, 2023	Continual LearningData Augmentation	CodeCode Available	1
MixPro: Data Augmentation with MaskMix and Progressive Attention Labeling for Vision Transformer	Apr 24, 2023	Data AugmentationImage Augmentation	CodeCode Available	1
Meta-optimized Contrastive Learning for Sequential Recommendation	Apr 16, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
PARFormer: Transformer-based Multi-Task Network for Pedestrian Attribute Recognition	Apr 14, 2023	AttributeData Augmentation	CodeCode Available	1
Fracture Detection in Pediatric Wrist Trauma X-ray Images Using YOLOv8 Algorithm	Apr 11, 2023	Data AugmentationFracture detection	CodeCode Available	1
Isolated Sign Language Recognition based on Tree Structure Skeleton Images	Apr 10, 2023	Data AugmentationPose Estimation	CodeCode Available	1
Hierarchical Disentanglement-Alignment Network for Robust SAR Vehicle Recognition	Apr 7, 2023	Data AugmentationDisentanglement	CodeCode Available	1
HyperTab: Hypernetwork Approach for Deep Learning on Small Tabular Datasets	Apr 7, 2023	Data AugmentationDeep Learning	CodeCode Available	1
A review of ensemble learning and data augmentation models for class imbalanced problems: combination, implementation and evaluation	Apr 6, 2023	Data AugmentationEnsemble Learning	CodeCode Available	1
DiGA: Distil to Generalize and then Adapt for Domain Adaptive Semantic Segmentation	Apr 5, 2023	Data AugmentationKnowledge Distillation	CodeCode Available	1
FakET: Simulating Cryo-Electron Tomograms with Neural Style Transfer	Apr 4, 2023	Data AugmentationGPU	CodeCode Available	1
Cross-modulated Few-shot Image Generation for Colorectal Tissue Classification	Apr 4, 2023	Data Augmentationimage-classification	CodeCode Available	1
Hierarchical Supervision and Shuffle Data Augmentation for 3D Semi-Supervised Object Detection	Apr 4, 2023	Data Augmentationobject-detection	CodeCode Available	1
Astroformer: More Data Might not be all you need for Classification	Apr 3, 2023	AllAstronomy	CodeCode Available	1
One-shot Unsupervised Domain Adaptation with Personalized Diffusion Models	Mar 31, 2023	Data AugmentationDomain Adaptation	CodeCode Available	1
Mixed Autoencoder for Self-supervised Visual Representation Learning	Mar 30, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
WordStylist: Styled Verbatim Handwritten Text Generation with Latent Diffusion Models	Mar 29, 2023	Data AugmentationDenoising	CodeCode Available	1
Improving the Transferability of Adversarial Samples by Path-Augmented Method	Mar 28, 2023	Data AugmentationImage Augmentation	CodeCode Available	1
Unsupervised Pre-Training For Data-Efficient Text-to-Speech On Low Resource Languages	Mar 28, 2023	Data Augmentationtext-to-speech	CodeCode Available	1
Learning the Unlearnable: Adversarial Augmentations Suppress Unlearnable Example Attacks	Mar 27, 2023	Data AugmentationData Poisoning	CodeCode Available	1
EEGMatch: Learning with Incomplete Labels for Semi-Supervised EEG-based Cross-Subject Emotion Recognition	Mar 27, 2023	Data AugmentationDomain Adaptation	CodeCode Available	1
VisDA 2022 Challenge: Domain Adaptation for Industrial Waste Sorting	Mar 26, 2023	Data AugmentationDiversity	CodeCode Available	1
Towards Diverse and Coherent Augmentation for Time-Series Forecasting	Mar 24, 2023	Data AugmentationDiversity	CodeCode Available	1
Debiased Contrastive Learning for Sequential Recommendation	Mar 21, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
MSTFormer: Motion Inspired Spatial-temporal Transformer with Dynamic-aware Attention for long-term Vessel Trajectory Prediction	Mar 21, 2023	Data AugmentationTrajectory Prediction	CodeCode Available	1
A Survey on Causal Inference for Recommendation	Mar 21, 2023	Causal Inferencecounterfactual	CodeCode Available	1
Motion Matters: Neural Motion Transfer for Better Camera Physiological Measurement	Mar 21, 2023	Data AugmentationPhotoplethysmography (PPG)	CodeCode Available	1
MixCycle: Mixup Assisted Semi-Supervised 3D Single Object Tracking with Cycle Consistency	Mar 16, 2023	3D Single Object TrackingData Augmentation	CodeCode Available	1
MSeg3D: Multi-modal 3D Semantic Segmentation for Autonomous Driving	Mar 15, 2023	3D Semantic SegmentationAutonomous Driving	CodeCode Available	1

Show:10 25 50

← PrevPage 12 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified