Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6501–6525 of 8378 papers

Title	Date	Tasks	Status
How Should Markup Tags Be Translated?	Nov 1, 2020	Data AugmentationMachine Translation	CodeCode Available
PATQUEST: Papago Translation Quality Estimation	Nov 1, 2020	Data AugmentationSentence	—Unverified
Tencent Neural Machine Translation Systems for the WMT20 News Translation Task	Nov 1, 2020	Data AugmentationMachine Translation	—Unverified
Noising Scheme for Data Augmentation in Automatic Post-Editing	Nov 1, 2020	Automatic Post-EditingData Augmentation	—Unverified
Facebook AI’s WMT20 News Translation Task Submission	Nov 1, 2020	Data AugmentationReranking	—Unverified
ColloQL: Robust Text-to-SQL Over Search Queries	Nov 1, 2020	Data AugmentationText to SQL	CodeCode Available
A multi-source approach for Breton–French hybrid machine translation	Nov 1, 2020	Data AugmentationMachine Translation	—Unverified
TextAttack: Lessons learned in designing Python frameworks for NLP	Nov 1, 2020	Adversarial AttackData Augmentation	—Unverified
Linguist Geeks on WNUT-2020 Task 2: COVID-19 Informative Tweet Identification using Progressive Trained Language Models and Data Augmentation	Nov 1, 2020	ArticlesData Augmentation	—Unverified
Quantifying the Evaluation of Heuristic Methods for Textual Data Augmentation	Nov 1, 2020	Data Augmentation	—Unverified
Detecting Entailment in Code-Mixed Hindi-English Conversations	Nov 1, 2020	Data AugmentationLanguage Modeling	CodeCode Available
Advancing Seq2seq with Joint Paraphrase Learning	Nov 1, 2020	Data AugmentationMulti-Task Learning	—Unverified
Reinforcement Learning with Imbalanced Dataset for Data-to-Text Medical Report Generation	Nov 1, 2020	Data AugmentationMedical Report Generation	—Unverified
Learning Physical Common Sense as Knowledge Graph Completion via BERT Data Augmentation and Constrained Tucker Factorization	Nov 1, 2020	Common Sense ReasoningData Augmentation	—Unverified
How to Make Neural Natural Language Generation as Reliable as Templates in Task-Oriented Dialogue	Nov 1, 2020	Data AugmentationDiversity	—Unverified
Textual Data Augmentation for Efficient Active Learning on Tiny Datasets	Nov 1, 2020	Active LearningData Augmentation	—Unverified
Planning and Generating Natural and Diverse Disfluent Texts as Augmentation for Disfluency Detection	Nov 1, 2020	Data Augmentation	—Unverified
Simple Data Augmentation with the Mask Token Improves Domain Adaptation for Dialog Act Tagging	Nov 1, 2020	Data AugmentationDomain Adaptation	—Unverified
Controllable Meaning Representation to Text Generation: Linearization and Data Augmentation Strategies	Nov 1, 2020	Data AugmentationDialogue Generation	—Unverified
MixKD: Towards Efficient Distillation of Large-scale Language Models	Nov 1, 2020	Data AugmentationKnowledge Distillation	—Unverified
BLT: Balancing Long-Tailed Datasets with Adversarially-Perturbed Images	Oct 30, 2020	Data AugmentationImage Generation	CodeCode Available
On the Performance of Convolutional Neural Networks under High and Low Frequency Information	Oct 30, 2020	Data AugmentationFace Recognition	—Unverified
COVID-FACT: A Fully-Automated Capsule Network-based Framework for Identification of COVID-19 Cases from Chest CT scans	Oct 30, 2020	Computed Tomography (CT)Data Augmentation	CodeCode Available
Improving Dialogue Breakdown Detection with Semi-Supervised Learning	Oct 30, 2020	Data Augmentation	—Unverified
All-Weather Object Recognition Using Radar and Infrared Sensing	Oct 30, 2020	AllData Augmentation	—Unverified

Show:10 25 50

← PrevPage 261 of 336Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified