Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6501–6550 of 8378 papers

Title	Date	Tasks	Status	Hype
How Should Markup Tags Be Translated?	Nov 1, 2020	Data AugmentationMachine Translation	CodeCode Available	0
PATQUEST: Papago Translation Quality Estimation	Nov 1, 2020	Data AugmentationSentence	—Unverified	0
Tencent Neural Machine Translation Systems for the WMT20 News Translation Task	Nov 1, 2020	Data AugmentationMachine Translation	—Unverified	0
Noising Scheme for Data Augmentation in Automatic Post-Editing	Nov 1, 2020	Automatic Post-EditingData Augmentation	—Unverified	0
Facebook AI’s WMT20 News Translation Task Submission	Nov 1, 2020	Data AugmentationReranking	—Unverified	0
ColloQL: Robust Text-to-SQL Over Search Queries	Nov 1, 2020	Data AugmentationText to SQL	CodeCode Available	0
A multi-source approach for Breton–French hybrid machine translation	Nov 1, 2020	Data AugmentationMachine Translation	—Unverified	0
TextAttack: Lessons learned in designing Python frameworks for NLP	Nov 1, 2020	Adversarial AttackData Augmentation	—Unverified	0
Linguist Geeks on WNUT-2020 Task 2: COVID-19 Informative Tweet Identification using Progressive Trained Language Models and Data Augmentation	Nov 1, 2020	ArticlesData Augmentation	—Unverified	0
Quantifying the Evaluation of Heuristic Methods for Textual Data Augmentation	Nov 1, 2020	Data Augmentation	—Unverified	0
Detecting Entailment in Code-Mixed Hindi-English Conversations	Nov 1, 2020	Data AugmentationLanguage Modeling	CodeCode Available	0
Advancing Seq2seq with Joint Paraphrase Learning	Nov 1, 2020	Data AugmentationMulti-Task Learning	—Unverified	0
Reinforcement Learning with Imbalanced Dataset for Data-to-Text Medical Report Generation	Nov 1, 2020	Data AugmentationMedical Report Generation	—Unverified	0
Learning Physical Common Sense as Knowledge Graph Completion via BERT Data Augmentation and Constrained Tucker Factorization	Nov 1, 2020	Common Sense ReasoningData Augmentation	—Unverified	0
How to Make Neural Natural Language Generation as Reliable as Templates in Task-Oriented Dialogue	Nov 1, 2020	Data AugmentationDiversity	—Unverified	0
Textual Data Augmentation for Efficient Active Learning on Tiny Datasets	Nov 1, 2020	Active LearningData Augmentation	—Unverified	0
Planning and Generating Natural and Diverse Disfluent Texts as Augmentation for Disfluency Detection	Nov 1, 2020	Data Augmentation	—Unverified	0
Simple Data Augmentation with the Mask Token Improves Domain Adaptation for Dialog Act Tagging	Nov 1, 2020	Data AugmentationDomain Adaptation	—Unverified	0
Controllable Meaning Representation to Text Generation: Linearization and Data Augmentation Strategies	Nov 1, 2020	Data AugmentationDialogue Generation	—Unverified	0
MixKD: Towards Efficient Distillation of Large-scale Language Models	Nov 1, 2020	Data AugmentationKnowledge Distillation	—Unverified	0
BLT: Balancing Long-Tailed Datasets with Adversarially-Perturbed Images	Oct 30, 2020	Data AugmentationImage Generation	CodeCode Available	0
On the Performance of Convolutional Neural Networks under High and Low Frequency Information	Oct 30, 2020	Data AugmentationFace Recognition	—Unverified	0
COVID-FACT: A Fully-Automated Capsule Network-based Framework for Identification of COVID-19 Cases from Chest CT scans	Oct 30, 2020	Computed Tomography (CT)Data Augmentation	CodeCode Available	0
Improving Dialogue Breakdown Detection with Semi-Supervised Learning	Oct 30, 2020	Data Augmentation	—Unverified	0
All-Weather Object Recognition Using Radar and Infrared Sensing	Oct 30, 2020	AllData Augmentation	—Unverified	0
A Model of Two Tales: Dual Transfer Learning Framework for Improved Long-tail Item Recommendation	Oct 29, 2020	Data AugmentationRecommendation Systems	—Unverified	0
Self-paced Data Augmentation for Training Neural Networks	Oct 29, 2020	Data AugmentationSingle Particle Analysis	—Unverified	0
Identification of complex mixtures for Raman spectroscopy using a novel scheme based on a new multi-label deep neural network	Oct 29, 2020	Data Augmentation	—Unverified	0
Conversation Graph: Data Augmentation, Training and Evaluation for Non-Deterministic Dialogue Management	Oct 29, 2020	Data AugmentationDialogue Management	CodeCode Available	0
Pretext-Contrastive Learning: Toward Good Practices in Self-supervised Video Representation Leaning	Oct 29, 2020	Contrastive LearningData Augmentation	CodeCode Available	1
Augmenting transferred representations for stock classification	Oct 28, 2020	ClassificationData Augmentation	—Unverified	0
Evaluating data augmentation for financial time series classification	Oct 28, 2020	ClassificationData Augmentation	CodeCode Available	0
Classification Beats Regression: Counting of Cells from Greyscale Microscopic Images based on Annotation-free Training Samples	Oct 28, 2020	Data Augmentationimage-classification	CodeCode Available	0
Improving Text Relationship Modeling with Artificial Data	Oct 27, 2020	BIG-bench Machine LearningClassification	—Unverified	0
Acoustic echo cancellation with the dual-signal transformation LSTM network	Oct 27, 2020	Acoustic echo cancellationData Augmentation	CodeCode Available	1
Graph Contrastive Learning with Adaptive Augmentation	Oct 27, 2020	AttributeContrastive Learning	CodeCode Available	1
CopyPaste: An Augmentation Method for Speech Emotion Recognition	Oct 27, 2020	Data AugmentationEmotion Recognition	—Unverified	0
Perception for Autonomous Systems (PAZ)	Oct 27, 2020	2D Object Detection6D Pose Estimation	CodeCode Available	1
Impact of Spherical Coordinates Transformation Pre-processing in Deep Convolution Neural Networks for Brain Tumor Segmentation and Survival Prediction	Oct 27, 2020	Brain Tumor SegmentationData Augmentation	—Unverified	0
Cross-directional Feature Fusion Network for Building Damage Assessment from Satellite Imagery	Oct 27, 2020	2D Semantic SegmentationBuilding Damage Assessment	—Unverified	0
Contrastive Learning for Sequential Recommendation	Oct 27, 2020	Contrastive LearningData Augmentation	CodeCode Available	1
Restrained Generative Adversarial Network against Overfitting in Numeric Data Augmentation	Oct 26, 2020	Data AugmentationGenerative Adversarial Network	—Unverified	0
Hierarchical Metadata-Aware Document Categorization under Weak Supervision	Oct 26, 2020	Data AugmentationDocument Classification	CodeCode Available	1
Method and Dataset Entity Mining in Scientific Literature: A CNN + Bi-LSTM Model with Self-attention	Oct 26, 2020	Data Augmentation	—Unverified	0
P^2 Net: Augmented Parallel-Pyramid Net for Attention Guided Pose Estimation	Oct 26, 2020	Data AugmentationPose Estimation	—Unverified	0
Exploiting Neural Query Translation into Cross Lingual Information Retrieval	Oct 26, 2020	Cross-Lingual Information RetrievalData Augmentation	—Unverified	0
Efficient Joinable Table Discovery in Data Lakes: A High-Dimensional Similarity-Based Approach	Oct 26, 2020	Data AugmentationData Integration	—Unverified	0
What is the best data augmentation for 3D brain tumor segmentation?	Oct 26, 2020	Brain Tumor SegmentationData Augmentation	CodeCode Available	1
Multi-stream Attention-based BLSTM with Feature Segmentation for Speech Emotion Recognition	Oct 25, 2020	Data AugmentationEmotional Speech Synthesis	—Unverified	0
Two-stage Textual Knowledge Distillation for End-to-End Spoken Language Understanding	Oct 25, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0

Show:10 25 50

← PrevPage 131 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified