Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 951–1000 of 8378 papers

Title	Date	Tasks	Status	Hype
A Locality-based Neural Solver for Optical Motion Capture	Sep 1, 2023	Data AugmentationGraph Neural Network	CodeCode Available	1
Minority-Focused Text-to-Image Generation via Prompt Optimization	Oct 10, 2024	Data AugmentationImage Generation	CodeCode Available	1
Mitigating Data Heterogeneity in Federated Learning with Data Augmentation	Jun 20, 2022	Data AugmentationDomain Generalization	CodeCode Available	1
Mitigating Data Sparsity for Short Text Topic Modeling by Topic-Semantic Contrastive Learning	Nov 23, 2022	Contrastive LearningData Augmentation	CodeCode Available	1
Mixed Autoencoder for Self-supervised Visual Representation Learning	Mar 30, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
MixEdit: Revisiting Data Augmentation and Beyond for Grammatical Error Correction	Oct 18, 2023	Data AugmentationDiversity	CodeCode Available	1
Mixing-Specific Data Augmentation Techniques for Improved Blind Violin/Piano Source Separation	Aug 6, 2020	Data AugmentationInformation Retrieval	CodeCode Available	1
Mixing Up Contrastive Learning: Self-Supervised Representation Learning for Time Series	Mar 17, 2022	Contrastive LearningData Augmentation	CodeCode Available	1
Contextual Similarity Aggregation with Self-attention for Visual Re-ranking	Oct 26, 2021	Content-Based Image RetrievalData Augmentation	CodeCode Available	1
Mixup for Node and Graph Classification	Jun 1, 2021	ClassificationData Augmentation	CodeCode Available	1
Alternate Diverse Teaching for Semi-supervised Medical Image Segmentation	Nov 29, 2023	Data AugmentationImage Segmentation	CodeCode Available	1
Progressive Multi-Modality Learning for Inverse Protein Folding	Dec 11, 2023	cross-modal alignmentData Augmentation	CodeCode Available	1
MoCoDA: Model-based Counterfactual Data Augmentation	Oct 20, 2022	counterfactualData Augmentation	CodeCode Available	1
MODALS: Modality-agnostic Automated Data Augmentation in the Latent Space	Jan 1, 2021	Data AugmentationTime Series	CodeCode Available	1
AltFreezing for More General Video Face Forgery Detection	Jul 17, 2023	Data Augmentation	CodeCode Available	1
Modeling the Probabilistic Distribution of Unlabeled Data forOne-shot Medical Image Segmentation	Feb 3, 2021	Data AugmentationImage Segmentation	CodeCode Available	1
Bidirectional Generative Framework for Cross-domain Aspect-based Sentiment Analysis	May 16, 2023	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available	1
Monkeypox Image Data collection	Jun 3, 2022	Data Augmentation	CodeCode Available	1
Anatomical Data Augmentation via Fluid-based Image Registration	Jul 5, 2020	Data AugmentationImage Augmentation	CodeCode Available	1
A Unified Analysis of Mixed Sample Data Augmentation: A Loss Function Perspective	Aug 21, 2022	Adversarial RobustnessData Augmentation	CodeCode Available	1
AugmentedNet: A Roman Numeral Analysis Network with Synthetic Training Examples and Additional Tonal Tasks	Nov 7, 2021	Chord RecognitionData Augmentation	CodeCode Available	1
Augmented Neural Fine-Tuning for Efficient Backdoor Purification	Jul 14, 2024	Action RecognitionData Augmentation	CodeCode Available	1
MotionAug: Augmentation with Physical Correction for Human Motion Prediction	Mar 17, 2022	Data AugmentationDiversity	CodeCode Available	1
Motion-Focused Contrastive Learning of Video Representations	Jan 11, 2022	Contrastive LearningData Augmentation	CodeCode Available	1
Contemplating real-world object classification	Mar 8, 2021	ClassificationData Augmentation	CodeCode Available	1
State-of-the-Art Augmented NLP Transformer models for direct and single-step retrosynthesis	Mar 5, 2020	Data AugmentationMemorization	CodeCode Available	1
Augmented Ultrasonic Data for Machine Learning	Mar 26, 2019	BIG-bench Machine LearningData Augmentation	CodeCode Available	1
Multi-attentional Deepfake Detection	Mar 3, 2021	Binary ClassificationData Augmentation	CodeCode Available	1
Continual Few-shot Relation Learning via Embedding Space Regularization and Data Augmentation	Mar 4, 2022	Data AugmentationRelation	CodeCode Available	1
Multi-level Cross-view Contrastive Learning for Knowledge-aware Recommender System	Apr 19, 2022	Contrastive LearningData Augmentation	CodeCode Available	1
Multi-modal Conditional Bounding Box Regression for Music Score Following	May 10, 2021	Data Augmentationobject-detection	CodeCode Available	1
Multimodal Data Augmentation for Visual-Infrared Person ReID with Corrupted Data	Nov 22, 2022	Data Augmentation	CodeCode Available	1
Augmenting DL with Adversarial Training for Robust Prediction of Epilepsy Seizures	Jun 1, 2020	BIG-bench Machine LearningData Augmentation	CodeCode Available	1
Augmenting Document Representations for Dense Retrieval with Interpolation and Perturbation	Mar 15, 2022	Data AugmentationInformation Retrieval	CodeCode Available	1
Multi-Sample based Contrastive Loss for Top-k Recommendation	Sep 1, 2021	Contrastive LearningData Augmentation	CodeCode Available	1
Multi-Spectral Image Synthesis for Crop/Weed Segmentation in Precision Farming	Sep 12, 2020	Data AugmentationImage Generation	CodeCode Available	1
Contrastive Learning for Knowledge Tracing	Apr 25, 2022	Contrastive LearningData Augmentation	CodeCode Available	1
An Asymptotically Optimal Multi-Armed Bandit Algorithm and Hyperparameter Optimization	Jul 11, 2020	Bayesian OptimizationData Augmentation	CodeCode Available	1
MUM: Mix Image Tiles and UnMix Feature Tiles for Semi-Supervised Object Detection	Jan 1, 2022	Data Augmentationobject-detection	CodeCode Available	1
MuMuQA: Multimedia Multi-Hop News Question Answering via Cross-Media Knowledge Extraction and Grounding	Dec 20, 2021	Answer GenerationArticles	CodeCode Available	1
Conditioned Text Generation with Transfer for Closed-Domain Dialogue Systems	Nov 3, 2020	Data AugmentationDiversity	CodeCode Available	1
Confident Sinkhorn Allocation for Pseudo-Labeling	Jun 13, 2022	Data AugmentationPseudo Label	CodeCode Available	1
Amharic LLaMA and LLaVA: Multimodal LLMs for Low Resource Languages	Mar 11, 2024	BenchmarkingData Augmentation	CodeCode Available	1
Augmenting Sequential Recommendation with Balanced Relevance and Diversity	Dec 11, 2024	Data AugmentationDiversity	CodeCode Available	1
Concatenated Masked Autoencoders as Spatial-Temporal Learner	Nov 2, 2023	Action RecognitionData Augmentation	CodeCode Available	1
A U-Net Based Discriminator for Generative Adversarial Networks	Feb 28, 2020	Conditional Image GenerationData Augmentation	CodeCode Available	1
Augmenting the User-Item Graph with Textual Similarity Models	Sep 20, 2021	Data AugmentationRecommendation Systems	CodeCode Available	1
Negative Data Augmentation	Feb 9, 2021	Action RecognitionAnomaly Detection	CodeCode Available	1
Conformal Prediction with Missing Values	Jun 5, 2023	Conformal PredictionData Augmentation	CodeCode Available	1
Composing Good Shots by Exploiting Mutual Relations	Jun 1, 2020	Data Augmentation	CodeCode Available	1

Show:10 25 50

← PrevPage 20 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified