Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 651–700 of 8378 papers

Title	Date	Tasks	Status	Hype
Testing and Improving the Robustness of Amortized Bayesian Inference for Cognitive Models	Dec 29, 2024	Bayesian InferenceData Augmentation	CodeCode Available	0
Goal-Conditioned Data Augmentation for Offline Reinforcement Learning	Dec 29, 2024	D4RLData Augmentation	—Unverified	0
Improving SSVEP BCI Spellers With Data Augmentation and Language Models	Dec 28, 2024	Brain Computer InterfaceData Augmentation	CodeCode Available	0
Adversarial Robustness for Deep Learning-based Wildfire Prediction Models	Dec 28, 2024	Adversarial AttackAdversarial Robustness	—Unverified	0
Predicting high dengue incidence in municipalities of Brazil using path signatures	Dec 27, 2024	Data AugmentationEpidemiology	—Unverified	0
Spectral-Temporal Fusion Representation for Person-in-Bed Detection	Dec 27, 2024	Data Augmentation	—Unverified	0
Focusing Image Generation to Mitigate Spurious Correlations	Dec 27, 2024	AttributeData Augmentation	—Unverified	0
Evaluating Convolutional Neural Networks for COVID-19 classification in chest X-ray images	Dec 26, 2024	Data Augmentation	—Unverified	0
Federated Hybrid Training and Self-Adversarial Distillation: Towards Robust Edge Networks	Dec 26, 2024	Data AugmentationFederated Learning	—Unverified	0
Attacking Voice Anonymization Systems with Augmented Feature and Speaker Identity Difference	Dec 26, 2024	Data AugmentationSpeaker Verification	—Unverified	0
Context-Aware Deep Learning for Multi Modal Depression Detection	Dec 26, 2024	Data AugmentationDeep Learning	CodeCode Available	1
Large Language Models for Market Research: A Data-augmentation Approach	Dec 26, 2024	Data AugmentationTransfer Learning	—Unverified	0
DiFiC: Your Diffusion Model Holds the Secret to Fine-Grained Clustering	Dec 25, 2024	ClusteringData Augmentation	—Unverified	0
Learning Broken Symmetries with Approximate Invariance	Dec 25, 2024	Data Augmentation	CodeCode Available	0
AEIOU: A Unified Defense Framework against NSFW Prompts in Text-to-Image Models	Dec 24, 2024	Data Augmentation	—Unverified	0
Data-Driven Self-Supervised Graph Representation Learning	Dec 24, 2024	Data AugmentationDocument Classification	CodeCode Available	0
Beyond the Known: Enhancing Open Set Domain Adaptation with Unknown Exploration	Dec 24, 2024	Data AugmentationDomain Adaptation	CodeCode Available	0
3DEnhancer: Consistent Multi-View Diffusion for 3D Enhancement	Dec 24, 2024	Data AugmentationNeural Rendering	—Unverified	0
WarriorCoder: Learning from Expert Battles to Augment Code Large Language Models	Dec 23, 2024	Data AugmentationDiversity	—Unverified	0
Improved Cotton Leaf Disease Classification Using Parameter-Efficient Deep Learning Framework	Dec 23, 2024	Data AugmentationTransfer Learning	—Unverified	0
SubstationAI: Multimodal Large Model-Based Approaches for Analyzing Substation Equipment Faults	Dec 22, 2024	Data AugmentationFault Diagnosis	—Unverified	0
Revisiting In-Context Learning with Long Context Language Models	Dec 22, 2024	Data AugmentationIn-Context Learning	—Unverified	0
Autonomous Crack Detection using Deep Learning on Synthetic Thermogram Datasets	Dec 21, 2024	Data AugmentationDeep Learning	—Unverified	0
FairDD: Enhancing Fairness with domain-incremental learning in dermatological disease diagnosis	Dec 21, 2024	Contrastive LearningData Augmentation	—Unverified	0
Enhancing Nighttime Vehicle Detection with Day-to-Night Style Transfer and Labeling-Free Augmentation	Dec 21, 2024	Data AugmentationGenerative Adversarial Network	—Unverified	0
Automated Classification of Cybercrime Complaints using Transformer-based Language Models for Hinglish Texts	Dec 21, 2024	Data Augmentation	—Unverified	0
Enhancing Contrastive Learning Inspired by the Philosophy of "The Blind Men and the Elephant"	Dec 21, 2024	Contrastive LearningData Augmentation	CodeCode Available	0
EnhancePPG: Improving PPG-based Heart Rate Estimation with Self-Supervision and Augmentation	Dec 20, 2024	Data AugmentationHeart rate estimation	—Unverified	0
DefFiller: Mask-Conditioned Diffusion for Salient Steel Surface Defect Generation	Dec 20, 2024	Data AugmentationDefect Detection	CodeCode Available	1
Function Space Diversity for Uncertainty Prediction via Repulsive Last-Layer Ensembles	Dec 20, 2024	Active LearningBayesian Inference	—Unverified	0
A Deep Probabilistic Framework for Continuous Time Dynamic Graph Generation	Dec 20, 2024	Anomaly DetectionData Augmentation	CodeCode Available	0
Label-Efficient Data Augmentation with Video Diffusion Models for Guidewire Segmentation in Cardiac Fluoroscopy	Dec 20, 2024	Data AugmentationSegmentation	—Unverified	0
Bag of Tricks for Multimodal AutoML with Image, Text, and Tabular Data	Dec 19, 2024	AutoMLcross-modal alignment	—Unverified	0
Enhancing Masked Time-Series Modeling via Dropping Patches	Dec 19, 2024	Cross-Domain Few-Shotcross-domain few-shot learning	CodeCode Available	0
ResoFilter: Fine-grained Synthetic Data Filtering for Large Language Models through Data-Parameter Resonance Analysis	Dec 19, 2024	Data AugmentationSynthetic Data Generation	CodeCode Available	1
DS^2-ABSA: Dual-Stream Data Synthesis with Label Refinement for Few-Shot Aspect-Based Sentiment Analysis	Dec 19, 2024	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available	1
Promptable Representation Distribution Learning and Data Augmentation for Gigapixel Histopathology WSI Analysis	Dec 19, 2024	Data AugmentationMultiple Instance Learning	CodeCode Available	0
Enhancing Diffusion Models for High-Quality Image Generation	Dec 19, 2024	Computational EfficiencyData Augmentation	—Unverified	0
Head and Neck Tumor Segmentation of MRI from Pre- and Mid-radiotherapy with Pre-training, Data Augmentation and Dual Flow UNet	Dec 19, 2024	Data AugmentationSegmentation	CodeCode Available	0
Retrieval Augmented Image Harmonization	Dec 18, 2024	Data AugmentationImage Harmonization	—Unverified	0
VaeDiff-DocRE: End-to-end Data Augmentation Framework for Document-level Relation Extraction	Dec 18, 2024	Data Augmentation	CodeCode Available	0
GenX: Mastering Code and Test Generation with Execution Feedback	Dec 18, 2024	Code GenerationData Augmentation	—Unverified	0
MixRec: Heterogeneous Graph Collaborative Filtering	Dec 18, 2024	Collaborative FilteringContrastive Learning	CodeCode Available	1
Synthetic Time Series Data Generation for Healthcare Applications: A PCG Case Study	Dec 17, 2024	Data AugmentationDiagnostic	—Unverified	0
Solid-SQL: Enhanced Schema-linking based In-context Learning for Robust Text-to-SQL	Dec 17, 2024	Data AugmentationIn-Context Learning	—Unverified	0
3D MedDiffusion: A 3D Medical Diffusion Model for Controllable and High-quality Medical Image Generation	Dec 17, 2024	CT ReconstructionData Augmentation	—Unverified	0
Sound Classification of Four Insect Classes	Dec 16, 2024	ClassificationData Augmentation	—Unverified	0
MGDA: Model-based Goal Data Augmentation for Offline Goal-conditioned Weighted Supervised Learning	Dec 16, 2024	Data AugmentationReinforcement Learning (RL)	—Unverified	0
PhysAug: A Physical-guided and Frequency-based Data Augmentation for Single-Domain Generalized Object Detection	Dec 16, 2024	Data AugmentationDomain Generalization	CodeCode Available	1
CLDA-YOLO: Visual Contrastive Learning Based Domain Adaptive YOLO Detector	Dec 16, 2024	Contrastive LearningData Augmentation	—Unverified	0

Show:10 25 50

← PrevPage 14 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified