Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2901–2950 of 8378 papers

Title	Date	Tasks	Status	Hype
Graph Structure and Feature Extrapolation for Out-of-Distribution Generalization	Jun 13, 2023	Data AugmentationOut-of-Distribution Generalization	—Unverified	0
Revisiting and Advancing Adversarial Training Through A Simple Baseline	Jun 13, 2023	Adversarial DefenseAdversarial Robustness	—Unverified	0
Generated Graph Detection	Jun 13, 2023	Data AugmentationFace Swapping	CodeCode Available	0
Parametric Implicit Face Representation for Audio-Driven Facial Reenactment	Jun 13, 2023	Data AugmentationImage Generation	—Unverified	0
Rethink the Effectiveness of Text Data Augmentation: An Empirical Analysis	Jun 13, 2023	Data AugmentationFew-Shot Learning	—Unverified	0
Time-aware Graph Structure Learning via Sequence Prediction on Temporal Graphs	Jun 13, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
Robustness and Generalization Performance of Deep Learning Models on Cyber-Physical Systems: A Comparative Study	Jun 13, 2023	Data AugmentationTime Series	CodeCode Available	0
Textual Augmentation Techniques Applied to Low Resource Machine Translation: Case of Swahili	Jun 12, 2023	Data AugmentationMachine Translation	—Unverified	0
Gender-Inclusive Grammatical Error Correction through Augmentation	Jun 12, 2023	Data AugmentationGrammatical Error Correction	CodeCode Available	0
Rotational augmentation techniques: a new perspective on ensemble learning for image classification	Jun 12, 2023	Data AugmentationEnsemble Learning	—Unverified	0
Underwater Acoustic Target Recognition based on Smoothness-inducing Regularization and Spectrogram-based Data Augmentation	Jun 12, 2023	Data Augmentation	—Unverified	0
AROID: Improving Adversarial Robustness Through Online Instance-Wise Data Augmentation	Jun 12, 2023	Adversarial RobustnessData Augmentation	CodeCode Available	0
Graph Mixup with Soft Alignments	Jun 11, 2023	Data AugmentationGraph Classification	—Unverified	0
HIPODE: Enhancing Offline Reinforcement Learning with High-Quality Synthetic Data from a Policy-Decoupled Approach	Jun 10, 2023	D4RLData Augmentation	—Unverified	0
Medical Data Augmentation via ChatGPT: A Case Study on Medication Identification and Medication Event Classification	Jun 10, 2023	Data Augmentation	—Unverified	0
Attention-stacked Generative Adversarial Network (AS-GAN)-empowered Sensor Data Augmentation for Online Monitoring of Manufacturing System	Jun 9, 2023	Data AugmentationGenerative Adversarial Network	—Unverified	0
Emotion Detection from EEG using Transfer Learning	Jun 9, 2023	Data AugmentationEEG	—Unverified	0
Improving LiDAR 3D Object Detection via Range-based Point Cloud Density Optimization	Jun 9, 2023	3D Object DetectionData Augmentation	—Unverified	0
LOST: A Mental Health Dataset of Low Self-esteem in Reddit Posts	Jun 8, 2023	Clinical KnowledgeData Augmentation	—Unverified	0
Enhancing Robustness of AI Offensive Code Generators via Data Augmentation	Jun 8, 2023	Data AugmentationDiversity	CodeCode Available	0
KIT's Multilingual Speech Translation System for IWSLT 2023	Jun 8, 2023	Data AugmentationRetrieval	CodeCode Available	0
Look Beneath the Surface: Exploiting Fundamental Symmetry for Sample-Efficient Offline RL	Jun 7, 2023	Data AugmentationOffline RL	CodeCode Available	1
Data Augmentation for Improving Tail-traffic Robustness in Skill-routing for Dialogue Systems	Jun 7, 2023	Data AugmentationDecoder	—Unverified	0
Flexible Distribution Alignment: Towards Long-tailed Semi-supervised Learning with Proper Calibration	Jun 7, 2023	Data Augmentation	CodeCode Available	1
Gotta: Generative Few-shot Question Answering by Prompt-based Cloze Data Augmentation	Jun 7, 2023	Data AugmentationQuestion Answering	CodeCode Available	0
Can current NLI systems handle German word order? Investigating language model performance on a new German challenge set of minimal pairs	Jun 7, 2023	Data AugmentationLanguage Modeling	CodeCode Available	0
T-ADAF: Adaptive Data Augmentation Framework for Image Classification Network based on Tensor T-product Operator	Jun 7, 2023	Data Augmentationimage-classification	—Unverified	0
Augmenting Reddit Posts to Determine Wellness Dimensions impacting Mental Health	Jun 6, 2023	Data AugmentationSemantic Similarity	CodeCode Available	0
Rec4Ad: A Free Lunch to Mitigate Sample Selection Bias for Ads CTR Prediction in Taobao	Jun 6, 2023	Click-Through Rate PredictionData Augmentation	—Unverified	0
Stabilizing Contrastive RL: Techniques for Robotic Goal Reaching from Offline Data	Jun 6, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
Towards Adaptable and Interactive Image Captioning with Data Augmentation and Episodic Memory	Jun 6, 2023	Continual LearningData Augmentation	—Unverified	0
Q: How to Specialize Large Vision-Language Models to Data-Scarce VQA Tasks? A: Self-Train on Unlabeled Images!	Jun 6, 2023	counterfactualData Augmentation	CodeCode Available	1
An Empirical Analysis of Parameter-Efficient Methods for Debiasing Pre-Trained Language Models	Jun 6, 2023	counterfactualData Augmentation	CodeCode Available	0
Synthesizing Affective Neurophysiological Signals Using Generative Models: A Review Paper	Jun 5, 2023	Data AugmentationEEG	—Unverified	0
Learning to Substitute Spans towards Improving Compositional Generalization	Jun 5, 2023	Data AugmentationInductive Bias	CodeCode Available	0
PULSAR: Pre-training with Extracted Healthcare Terms for Summarising Patients' Problems and Data Augmentation with Black-box Large Language Models	Jun 5, 2023	Data Augmentation	CodeCode Available	0
Conformal Prediction with Missing Values	Jun 5, 2023	Conformal PredictionData Augmentation	CodeCode Available	1
Improving Conversational Recommendation Systems via Counterfactual Data Simulation	Jun 5, 2023	Conversational Recommendationcounterfactual	CodeCode Available	1
R-Mixup: Riemannian Mixup for Biological Networks	Jun 5, 2023	Data Augmentation	—Unverified	0
Graph Transformer for Recommendation	Jun 4, 2023	Collaborative FilteringData Augmentation	CodeCode Available	1
Large Language Model Augmented Narrative Driven Recommendations	Jun 4, 2023	Data AugmentationLanguage Modeling	CodeCode Available	0
An Improved Model for Diabetic Retinopathy Detection by using Transfer Learning and Ensemble Learning	Jun 3, 2023	Data AugmentationDiabetic Retinopathy Detection	—Unverified	0
Low-Complexity Acoustic Scene Classification Using Data Augmentation and Lightweight ResNet	Jun 3, 2023	Acoustic Scene ClassificationData Augmentation	—Unverified	0
Generative Adversarial Networks for Data Augmentation	Jun 3, 2023	Data AugmentationDomain Adaptation	—Unverified	0
Conditional Generation from Unconditional Diffusion Models using Denoiser Representations	Jun 2, 2023	AttributeData Augmentation	CodeCode Available	0
DiffECG: A Versatile Probabilistic Diffusion Model for ECG Signals Synthesis	Jun 2, 2023	Data AugmentationDenoising	—Unverified	0
EPIC: Graph Augmentation with Edit Path Interpolation via Learnable Cost	Jun 2, 2023	Data AugmentationGraph Classification	—Unverified	0
Affinity Clustering Framework for Data Debiasing Using Pairwise Distribution Discrepancy	Jun 2, 2023	AttributeClustering	CodeCode Available	0
ChatGPT for Zero-shot Dialogue State Tracking: A Solution or an Opportunity?	Jun 2, 2023	Data AugmentationDialogue State Tracking	—Unverified	0
Quantifying Sample Anonymity in Score-Based Generative Models with Adversarial Fingerprinting	Jun 2, 2023	Anomaly DetectionData Augmentation	—Unverified	0

Show:10 25 50

← PrevPage 59 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified