Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3051–3075 of 8378 papers

Title	Date	Tasks	Status	Hype
Making More of Little Data: Improving Low-Resource Automatic Speech Recognition Using Data Augmentation	May 18, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
BioAug: Conditional Generation based Data Augmentation for Low-Resource Biomedical NER	May 18, 2023	Data Augmentationnamed-entity-recognition	CodeCode Available	0
Inspecting the Geographical Representativeness of Images from Text-to-Image Models	May 18, 2023	Data AugmentationMarketing	—Unverified	0
Boosting Distress Support Dialogue Responses with Motivational Interviewing Strategy	May 17, 2023	ChatbotData Augmentation	CodeCode Available	0
Sharpness & Shift-Aware Self-Supervised Learning	May 17, 2023	ClassificationContrastive Learning	—Unverified	0
An Ensemble Deep Learning Approach for COVID-19 Severity Prediction Using Chest CT Scans	May 17, 2023	Computed Tomography (CT)Data Augmentation	CodeCode Available	0
Rethinking Data Augmentation for Tabular Data in Deep Learning	May 17, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
Advising OpenMP Parallelization via a Graph-Based Approach with Transformers	May 16, 2023	Data Augmentation	CodeCode Available	0
Data Augmentation for Conflict and Duplicate Detection in Software Engineering Sentence Pairs	May 16, 2023	Data AugmentationLEMMA	—Unverified	0
Adversarial Word Dilution as Text Data Augmentation in Low-Resource Regime	May 16, 2023	ClassificationData Augmentation	CodeCode Available	0
Boosting Event Extraction with Denoised Structure-to-Text Augmentation	May 16, 2023	Data AugmentationDeep Reinforcement Learning	—Unverified	0
Bidirectional Generative Framework for Cross-domain Aspect-based Sentiment Analysis	May 16, 2023	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available	1
Learning Better Contrastive View from Radiologist's Gaze	May 15, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
Improved baselines for vision-language pre-training	May 15, 2023	Contrastive LearningData Augmentation	—Unverified	0
Exploiting Frequency Spectrum of Adversarial Images for General Robustness	May 15, 2023	Data Augmentation	—Unverified	0
t-RAIN: Robust generalization under weather-aliasing label shift attacks	May 15, 2023	Autonomous VehiclesData Augmentation	—Unverified	0
AdamR at SemEval-2023 Task 10: Solving the Class Imbalance Problem in Sexism Detection with Ensemble Learning	May 15, 2023	Data AugmentationEnsemble Learning	—Unverified	0
Learning to Generalize for Cross-domain QA	May 14, 2023	Data AugmentationDomain Generalization	CodeCode Available	0
DAC-MR: Data Augmentation Consistency Based Meta-Regularization for Meta-Learning	May 13, 2023	Data AugmentationMeta-Learning	CodeCode Available	1
SCENE: Self-Labeled Counterfactuals for Extrapolating to Negative Examples	May 13, 2023	Data AugmentationNatural Language Inference	CodeCode Available	0
Consistency Regularization for Domain Generalization with Logit Attribution Matching	May 13, 2023	Data AugmentationDomain Generalization	CodeCode Available	0
Cloud-RAIN: Point Cloud Analysis with Reflectional Invariance	May 13, 2023	Data Augmentation	CodeCode Available	0
Subject-based Non-contrastive Self-Supervised Learning for ECG Signal Processing	May 12, 2023	Data AugmentationElectrocardiography (ECG)	—Unverified	0
Improving Small Language Models on PubMedQA via Generative Data Augmentation	May 12, 2023	Data AugmentationQuestion Answering	—Unverified	0
Uncertainty Estimation and Out-of-Distribution Detection for Deep Learning-Based Image Reconstruction using the Local Lipschitz	May 12, 2023	Computed Tomography (CT)Data Augmentation	—Unverified	0

Show:10 25 50

← PrevPage 123 of 336Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified