Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5176–5200 of 8378 papers

Title	Date	Tasks	Status	Hype
Long Term Stock Prediction based on Financial Statements	Nov 1, 2021	Data AugmentationPrediction	CodeCode Available	0
Tencent Translation System for the WMT21 News Translation Task	Nov 1, 2021	Data AugmentationTranslation	—Unverified	0
The LMU Munich System for the WMT 2021 Large-Scale Multilingual Machine Translation Shared Task	Nov 1, 2021	Data AugmentationKnowledge Distillation	—Unverified	0
Contrastive Learning for Context-aware Neural Machine Translation Using Coreference Information	Nov 1, 2021	Contrastive Learningcoreference-resolution	—Unverified	0
HW-TSC’s Participation at WMT 2021 Quality Estimation Shared Task	Nov 1, 2021	AllData Augmentation	—Unverified	0
TermMind: Alibaba’s WMT21 Machine Translation Using Terminologies Task Submission	Nov 1, 2021	Data AugmentationMachine Translation	—Unverified	0
NVIDIA NeMo’s Neural Machine Translation Systems for English-German and English-Russian News and Biomedical Tasks at WMT21	Nov 1, 2021	Data AugmentationKnowledge Distillation	—Unverified	0
SpanAlign: Efficient Sequence Tagging Annotation Projection into Translated Data applied to Cross-Lingual Opinion Mining	Nov 1, 2021	Data AugmentationMachine Translation	—Unverified	0
DMix: Distance Constrained Interpolative Mixup	Nov 1, 2021	ClassificationData Augmentation	—Unverified	0
Sequence Mixup for Zero-Shot Cross-Lingual Part-Of-Speech Tagging	Nov 1, 2021	Cross-Lingual TransferData Augmentation	—Unverified	0
HypMix: Hyperbolic Interpolative Data Augmentation	Nov 1, 2021	Adversarial RobustnessData Augmentation	CodeCode Available	1
Learning Data Augmentation Schedules for Natural Language Processing	Nov 1, 2021	Data AugmentationScheduling	CodeCode Available	0
A Semantic Feature-Wise Transformation Relation Network for Automatic Short Answer Grading	Nov 1, 2021	automatic short answer gradingData Augmentation	—Unverified	0
Reinforced Counterfactual Data Augmentation for Dual Sentiment Classification	Nov 1, 2021	Classificationcounterfactual	CodeCode Available	0
AESOP: Paraphrase Generation with Adaptive Syntactic Control	Nov 1, 2021	Data AugmentationLanguage Modeling	CodeCode Available	1
Simple Conversational Data Augmentation for Semi-supervised Abstractive Dialogue Summarization	Nov 1, 2021	Abstractive Dialogue SummarizationConversation Summarization	CodeCode Available	1
Machine Reading Comprehension as Data Augmentation: A Case Study on Implicit Event Argument Extraction	Nov 1, 2021	Data AugmentationEvent Argument Extraction	—Unverified	0
Gradient-Based Adversarial Factual Consistency Evaluation for Abstractive Summarization	Nov 1, 2021	Abstractive Text SummarizationData Augmentation	—Unverified	0
Semantics-Preserved Data Augmentation for Aspect-Based Sentiment Analysis	Nov 1, 2021	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	—Unverified	0
TADPOLE: Task ADapted Pre-Training via AnOmaLy DEtection	Nov 1, 2021	Anomaly DetectionData Augmentation	—Unverified	0
Can Question Generation Debias Question Answering Models? A Case Study on Question–Context Lexical Overlap	Nov 1, 2021	Data AugmentationQuestion Answering	—Unverified	0
PDALN: Progressive Domain Adaptation over a Pre-trained Model for Low-Resource Cross-Domain Named Entity Recognition	Nov 1, 2021	Cross-Domain Named Entity RecognitionData Augmentation	—Unverified	0
Can We Improve Model Robustness through Secondary Attribute Counterfactuals?	Nov 1, 2021	Attributecoreference-resolution	—Unverified	0
Unsupervised Paraphrasing Consistency Training for Low Resource Named Entity Recognition	Nov 1, 2021	Data AugmentationLow Resource Named Entity Recognition	—Unverified	0
NDH-Full: Learning and Evaluating Navigational Agents on Full-Length Dialogue	Nov 1, 2021	Data AugmentationDynamic Time Warping	CodeCode Available	0

Show:10 25 50

← PrevPage 208 of 336Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified