Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 501–550 of 8378 papers

Title	Date	Tasks	Status	Hype
APBench: A Unified Benchmark for Availability Poisoning Attacks and Defenses	Aug 7, 2023	Data Augmentation	CodeCode Available	1
Generation of Realistic Synthetic Raw Radar Data for Automated Driving Applications using Generative Adversarial Networks	Aug 4, 2023	Data AugmentationEdge Detection	CodeCode Available	1
MusicLDM: Enhancing Novelty in Text-to-Music Generation Using Beat-Synchronous Mixup Strategies	Aug 3, 2023	Audio GenerationBeat Tracking	CodeCode Available	1
LiDAR View Synthesis for Robust Vehicle Navigation Without Expert Labels	Aug 2, 2023	Data AugmentationSelf-Driving Cars	CodeCode Available	1
Pre-training Vision Transformers with Very Limited Synthesized Images	Jul 27, 2023	Data Augmentation	CodeCode Available	1
MARIO: Model Agnostic Recipe for Improving OOD Generalization of Graph Contrastive Learning	Jul 24, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
HybridAugment++: Unified Frequency Spectra Perturbations for Model Robustness	Jul 21, 2023	Adversarial RobustnessData Augmentation	CodeCode Available	1
LatentAugment: Data Augmentation via Guided Manipulation of GAN's Latent Space	Jul 21, 2023	Data AugmentationDiversity	CodeCode Available	1
What do neural networks learn in image classification? A frequency shortcut perspective	Jul 19, 2023	Data Augmentationimage-classification	CodeCode Available	1
Text-guided Image Restoration and Semantic Enhancement for Text-to-Image Person Retrieval	Jul 18, 2023	cross-modal alignmentData Augmentation	CodeCode Available	1
Domain Adaptation based Object Detection for Autonomous Driving in Foggy and Rainy Weather	Jul 18, 2023	Autonomous DrivingAutonomous Vehicles	CodeCode Available	1
AltFreezing for More General Video Face Forgery Detection	Jul 17, 2023	Data Augmentation	CodeCode Available	1
MixupExplainer: Generalizing Explanations for Graph Neural Networks with Data Augmentation	Jul 15, 2023	Data Augmentation	CodeCode Available	1
Why Does Little Robustness Help? A Further Step Towards Understanding Adversarial Transferability	Jul 15, 2023	AttributeData Augmentation	CodeCode Available	1
Controllable Data Augmentation for Few-Shot Text Mining with Chain-of-Thought Attribute Manipulation	Jul 14, 2023	Aspect-Based Sentiment AnalysisAttribute	CodeCode Available	1
Generative Contrastive Graph Learning for Recommendation	Jul 11, 2023	Collaborative FilteringContrastive Learning	CodeCode Available	1
Distill-SODA: Distilling Self-Supervised Vision Transformer for Source-Free Open-Set Domain Adaptation in Computational Pathology	Jul 10, 2023	Data AugmentationDomain Adaptation	CodeCode Available	1
Exploring Multimodal Approaches for Alzheimer's Disease Detection Using Patient Speech Transcript and Audio Data	Jul 5, 2023	Alzheimer's Disease DetectionContrastive Learning	CodeCode Available	1
ECG-Image-Kit: A Synthetic Image Generation Toolbox to Facilitate Deep Learning-Based Electrocardiogram Digitization	Jul 4, 2023	Data AugmentationDecision Making	CodeCode Available	1
PIGNet2: A Versatile Deep Learning-based Protein-Ligand Interaction Prediction Model for Binding Affinity Scoring and Virtual Screening	Jul 3, 2023	Data AugmentationDrug Discovery	CodeCode Available	1
Intra- & Extra-Source Exemplar-Based Style Synthesis for Improved Domain Generalization	Jul 2, 2023	Autonomous DrivingData Augmentation	CodeCode Available	1
Generative Data Augmentation for Aspect Sentiment Quad Prediction	Jul 1, 2023	Aspect-Based Sentiment Analysis (ABSA)Data Augmentation	CodeCode Available	1
MedAugment: Universal Automatic Data Augmentation Plug-in for Medical Image Analysis	Jun 30, 2023	Data AugmentationDiagnostic	CodeCode Available	1
Uncovering the Limits of Machine Learning for Automatic Vulnerability Detection	Jun 28, 2023	BenchmarkingData Augmentation	CodeCode Available	1
Neural Bayes estimators for censored inference with peaks-over-threshold models	Jun 27, 2023	Data Augmentation	CodeCode Available	1
Cross-Lingual Cross-Age Group Adaptation for Low-Resource Elderly Speech Emotion Recognition	Jun 26, 2023	Data AugmentationEmotion Recognition	CodeCode Available	1
Beyond OOD State Actions: Supported Cross-Domain Offline Reinforcement Learning	Jun 22, 2023	Data AugmentationOffline RL	CodeCode Available	1
A systematic approach to deep learning-based nodule detection in chest radiographs	Jun 21, 2023	Data AugmentationLung Nodule Detection	CodeCode Available	1
DuTa-VC: A Duration-aware Typical-to-atypical Voice Conversion Approach with Diffusion Probabilistic Model	Jun 18, 2023	Data AugmentationDecoder	CodeCode Available	1
Improving Generalizability of Graph Anomaly Detection Models via Data Augmentation	Jun 18, 2023	Anomaly DetectionData Augmentation	CodeCode Available	1
Time-aware Graph Structure Learning via Sequence Prediction on Temporal Graphs	Jun 13, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
Flexible Distribution Alignment: Towards Long-tailed Semi-supervised Learning with Proper Calibration	Jun 7, 2023	Data Augmentation	CodeCode Available	1
Look Beneath the Surface: Exploiting Fundamental Symmetry for Sample-Efficient Offline RL	Jun 7, 2023	Data AugmentationOffline RL	CodeCode Available	1
Stabilizing Contrastive RL: Techniques for Robotic Goal Reaching from Offline Data	Jun 6, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
Q: How to Specialize Large Vision-Language Models to Data-Scarce VQA Tasks? A: Self-Train on Unlabeled Images!	Jun 6, 2023	counterfactualData Augmentation	CodeCode Available	1
Conformal Prediction with Missing Values	Jun 5, 2023	Conformal PredictionData Augmentation	CodeCode Available	1
Improving Conversational Recommendation Systems via Counterfactual Data Simulation	Jun 5, 2023	Conversational Recommendationcounterfactual	CodeCode Available	1
Graph Transformer for Recommendation	Jun 4, 2023	Collaborative FilteringData Augmentation	CodeCode Available	1
Self Contrastive Learning for Session-based Recommendation	Jun 2, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
A Multi-dimensional Deep Structured State Space Approach to Speech Enhancement Using Small-footprint Models	Jun 1, 2023	Data AugmentationSpeech Enhancement	CodeCode Available	1
Improving the Robustness of Summarization Systems with Dual Augmentation	Jun 1, 2023	Data AugmentationDecoder	CodeCode Available	1
ACLM: A Selective-Denoising based Generative Data Augmentation Approach for Low-Resource Complex NER	Jun 1, 2023	Data AugmentationDenoising	CodeCode Available	1
Geo-Tiles for Semantic Segmentation of Earth Observation Imagery	Jun 1, 2023	Data AugmentationEarth Observation	CodeCode Available	1
Source Code Data Augmentation for Deep Learning: A Survey	May 31, 2023	Data AugmentationDeep Learning	CodeCode Available	1
A Survey of Label-Efficient Deep Learning for 3D Point Clouds	May 31, 2023	Data AugmentationDeep Learning	CodeCode Available	1
A Shapelet-based Framework for Unsupervised Multivariate Time Series Representation Learning	May 30, 2023	Anomaly DetectionData Augmentation	CodeCode Available	1
Improved Probabilistic Image-Text Representations	May 29, 2023	Data AugmentationImage-text matching	CodeCode Available	1
LM-CPPF: Paraphrasing-Guided Data Augmentation for Contrastive Prompt-Based Few-Shot Fine-Tuning	May 29, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
PDE+: Enhancing Generalization via PDE with Adaptive Distributional Diffusion	May 25, 2023	Data Augmentation	CodeCode Available	1
VanillaKD: Revisit the Power of Vanilla Knowledge Distillation from Small Scale to Large Scale	May 25, 2023	Data AugmentationKnowledge Distillation	CodeCode Available	1

Show:10 25 50

← PrevPage 11 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified