Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5101–5150 of 8378 papers

Title	Date	Tasks	Status	Hype
Single-stage uav detection and classification with yolov5: Mosaic data augmentation and panet	Nov 16, 2021	2D Object DetectionData Augmentation	CodeCode Available	0
Retrieval-guided Counterfactual Generation for QA	Nov 16, 2021	counterfactualData Augmentation	—Unverified	0
When Chosen Wisely, More Data Is What You Need: A Universal Sample-Efficient Strategy For Data Augmentation	Nov 16, 2021	Data AugmentationHellaSwag	—Unverified	0
QA Domain Adaptation using Data Augmentation and Contrastive Adaptation	Nov 16, 2021	Data AugmentationDomain Adaptation	—Unverified	0
An Empirical Survey of the Effectiveness of Debiasing Techniques for Pre-trained Language Models	Nov 16, 2021	counterfactualData Augmentation	—Unverified	0
Learning to Ignore Adversarial Attacks	Nov 16, 2021	Data Augmentation	—Unverified	0
Context-Aware Language Modeling for Goal-Oriented Dialogue Systems	Nov 16, 2021	Data AugmentationGoal-Oriented Dialogue Systems	—Unverified	0
Target-Guided Dialogue Response Generation Using Commonsense and Data Augmentation	Nov 16, 2021	Data AugmentationResponse Generation	—Unverified	0
Retrieval Data Augmentation Informed by Downstream Question Answering Performance	Nov 16, 2021	Data AugmentationQuestion Answering	—Unverified	0
EveMRC: A Two-stage Evidence Modeling For Multi-choice Machine Reading Comprehension	Nov 16, 2021	Data AugmentationMachine Reading Comprehension	—Unverified	0
Contrastive Learning for Low Resource Machine Translation	Nov 16, 2021	Contrastive LearningData Augmentation	—Unverified	0
Data Augmentation with Sentence Recombination Method for Semi-supervised Text Classification	Nov 16, 2021	Data AugmentationSemi-Supervised Text Classification	—Unverified	0
PESTO: A Post-User Fusion Network for Rumour Detection on Social Media	Nov 16, 2021	Data AugmentationMisinformation	—Unverified	0
UNICON: Unsupervised Intent Discovery via Semantic-level Contrastive Learning	Nov 16, 2021	ClusteringContrastive Learning	—Unverified	0
TransSGAN: GAN based semi-superivsed learning for text classification with Transformer Encoder	Nov 16, 2021	Data Augmentationtext-classification	—Unverified	0
Continual Few-shot Relation Learning via Embedding Space Regularization and Data Augmentation	Nov 16, 2021	Data AugmentationRelation	—Unverified	0
Text Smoothing: Enhance Various Data Augmentation Methods on Text Classification Tasks	Nov 16, 2021	Data AugmentationLanguage Modeling	—Unverified	0
Explicit Modeling the Context for Chinese NER	Nov 16, 2021	Data Augmentationnamed-entity-recognition	—Unverified	0
LINDA: Unsupervised Learning to Interpolate in Natural Language Processing	Nov 16, 2021	Data Augmentationtext-classification	—Unverified	0
DAML: Chinese Named Entity Recognition with a fusion method of data-augmentation and meta-learning	Nov 16, 2021	Chinese Named Entity RecognitionData Augmentation	—Unverified	0
CST5: Data augmentation for Code-Switched Semantic Parsing	Nov 16, 2021	Data AugmentationSemantic Parsing	—Unverified	0
DAWSON: Data Augmentation using Weak Supervision On Natural Language	Nov 16, 2021	Data AugmentationLanguage Modeling	—Unverified	0
Towards Better Citation Intent Classification	Nov 16, 2021	ArticlesCitation Intent Classification	—Unverified	0
Logic-Driven Context Extension and Data Augmentation for Logical Reasoning of Text	Nov 16, 2021	Contrastive LearningData Augmentation	—Unverified	0
BERT is Robust! A Case Against Synonym-Based Adversarial Examples in Text Classification	Nov 16, 2021	Data Augmentationtext-classification	—Unverified	0
Quantum-inspired Representation for Long-tail Senses of Word Sense Disambiguation	Nov 16, 2021	Data AugmentationWord Sense Disambiguation	—Unverified	0
Data Augmentation for Intent Classification with Generic Large Language Models	Nov 16, 2021	ClassificationData Augmentation	—Unverified	0
Data Augmentation and Learned Layer Aggregation for Improved Multilingual Language Understanding in Dialogue	Nov 16, 2021	Data AugmentationNatural Language Understanding	—Unverified	0
Global Mixup: Eliminating Ambiguity with Clustering Relationships	Nov 16, 2021	ClusteringData Augmentation	—Unverified	0
Improving Multimodal Speech Recognition by Data Augmentation and Speech Representations	Nov 16, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Compositional Data Augmentation for Abstractive Conversation Summarization	Nov 16, 2021	Conversation SummarizationData Augmentation	—Unverified	0
Addressing Resource and Privacy Constraints in Semantic Parsing Through Data Augmentation	Nov 16, 2021	Data AugmentationSemantic Parsing	—Unverified	0
SegMix: A Simple Structure-Aware Data Augmentation Method	Nov 16, 2021	Data Augmentationnamed-entity-recognition	—Unverified	0
Vec2Node: Self-training with Tensor Augmentation for Text Classification with Few Labels	Nov 16, 2021	Data AugmentationTensor Decomposition	—Unverified	0
Do We Need to Differentiate Negative Candidates Before Training a Neural Ranker?	Nov 16, 2021	Data AugmentationQuestion Answering	—Unverified	0
Improving Robustness of Language Models from a Geometry-aware Perspective	Nov 16, 2021	Data Augmentation	—Unverified	0
TextMosaic: A New Data Augmentation Method for Named Entity Recognition Using Document-Level Contexts	Nov 16, 2021	Data AugmentationGPU	—Unverified	0
MoRe-Fi: Motion-robust and Fine-grained Respiration Monitoring via Deep-Learning UWB Radar	Nov 16, 2021	Data AugmentationDecoder	—Unverified	0
NVIDIA NeMo Neural Machine Translation Systems for English-German and English-Russian News and Biomedical Tasks at WMT21	Nov 16, 2021	Data AugmentationKnowledge Distillation	—Unverified	0
Data Augmentation using Random Image Cropping for High-resolution Virtual Try-On (VITON-CROP)	Nov 16, 2021	Data AugmentationImage Cropping	—Unverified	0
Analysis of Data Augmentation Methods for Low-Resource Maltese ASR	Nov 15, 2021	Data AugmentationLanguage Modeling	—Unverified	0
T-AutoML: Automated Machine Learning for Lesion Segmentation using Transformers in 3D Medical Imaging	Nov 15, 2021	AutoMLData Augmentation	—Unverified	0
Reinforcement Learning of Self Enhancing Camera Image and Signal Processing	Nov 15, 2021	BlockingData Augmentation	CodeCode Available	0
Evaluating Contrastive Learning on Wearable Timeseries for Downstream Clinical Outcomes	Nov 13, 2021	Contrastive LearningData Augmentation	—Unverified	0
Extraction of Medication Names from Twitter Using Augmentation and an Ensemble of Language Models	Nov 12, 2021	Data Augmentation	—Unverified	0
AnswerSumm: A Manually-Curated Dataset and Pipeline for Answer Summarization	Nov 11, 2021	Community Question AnsweringData Augmentation	CodeCode Available	1
Character-level HyperNetworks for Hate Speech Detection	Nov 11, 2021	Data AugmentationHate Speech Detection	CodeCode Available	0
Improving Novelty Detection using the Reconstructions of Nearest Neighbours	Nov 11, 2021	Anomaly DetectionData Augmentation	CodeCode Available	0
Towards Domain-Independent and Real-Time Gesture Recognition Using mmWave Signal	Nov 11, 2021	Data AugmentationGesture Recognition	CodeCode Available	1
Graph Transplant: Node Saliency-Guided Graph Mixup with Local Structure Preservation	Nov 10, 2021	Data AugmentationGraph Classification	—Unverified	0

Show:10 25 50

← PrevPage 103 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified