Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5801–5850 of 8378 papers

Title	Date	Tasks	Status
Extraction of Medication Names from Twitter Using Augmentation and an Ensemble of Language Models	Nov 12, 2021	Data Augmentation	—Unverified
Character-level HyperNetworks for Hate Speech Detection	Nov 11, 2021	Data AugmentationHate Speech Detection	CodeCode Available
Improving Novelty Detection using the Reconstructions of Nearest Neighbours	Nov 11, 2021	Anomaly DetectionData Augmentation	CodeCode Available
Graph Transplant: Node Saliency-Guided Graph Mixup with Local Structure Preservation	Nov 10, 2021	Data AugmentationGraph Classification	—Unverified
Data Augmentation Can Improve Robustness	Nov 9, 2021	Data Augmentation	—Unverified
Real-time Instance Segmentation of Surgical Instruments using Attention and Multi-scale Feature Fusion	Nov 9, 2021	Data AugmentationInstance Segmentation	—Unverified
Procurements with Bidder Asymmetry in Cost and Risk-Aversion	Nov 8, 2021	counterfactualData Augmentation	—Unverified
A Relational Model for One-Shot Classification	Nov 8, 2021	ClassificationData Augmentation	—Unverified
Off-policy Imitation Learning from Visual Inputs	Nov 8, 2021	Data AugmentationImitation Learning	—Unverified
LiMoSeg: Real-time Bird's Eye View based LiDAR Motion Segmentation	Nov 8, 2021	Autonomous DrivingData Augmentation	—Unverified
Developing neural machine translation models for Hungarian-English	Nov 7, 2021	Data AugmentationDependency Parsing	—Unverified
Solving the Class Imbalance Problem Using a Counterfactual Method for Data Augmentation	Nov 5, 2021	counterfactualData Augmentation	CodeCode Available
A Syntax-Guided Grammatical Error Correction Model with Dependency Tree Correction	Nov 5, 2021	Data AugmentationGrammatical Error Correction	—Unverified
Sexism Identification in Tweets and Gabs using Deep Neural Networks	Nov 5, 2021	ClassificationData Augmentation	—Unverified
CGCL: Collaborative Graph Contrastive Learning without Handcrafted Graph Data Augmentations	Nov 5, 2021	Contrastive LearningData Augmentation	CodeCode Available
Augmentations in Graph Contrastive Learning: Current Methodological Flaws & Towards Better Practices	Nov 5, 2021	ClassificationContrastive Learning	—Unverified
Human Age Estimation from Gene Expression Data using Artificial Neural Networks	Nov 4, 2021	Age EstimationData Augmentation	—Unverified
Voice Conversion Can Improve ASR in Very Low-Resource Settings	Nov 4, 2021	Data Augmentationspeech-recognition	—Unverified
A PubMedBERT-based Classifier with Data Augmentation Strategy for Detecting Medication Mentions in Tweets	Nov 3, 2021	Data AugmentationManagement	—Unverified
Koopman Q-learning: Offline Reinforcement Learning via Symmetries of Dynamics	Nov 2, 2021	D4RLData Augmentation	—Unverified
A Hybrid Approach for Learning to Shift and Grasp with Elaborate Motion Primitives	Nov 2, 2021	Data Augmentation	—Unverified
Meta-Learning to Improve Pre-Training	Nov 2, 2021	Data AugmentationHyperparameter Optimization	—Unverified
ISP-Agnostic Image Reconstruction for Under-Display Cameras	Nov 2, 2021	Data AugmentationDiversity	—Unverified
Data Augmentation of Incorporating Real Error Patterns and Linguistic Knowledge for Grammatical Error Correction	Nov 1, 2021	Data AugmentationGrammatical Error Correction	—Unverified
DMix: Distance Constrained Interpolative Mixup	Nov 1, 2021	ClassificationData Augmentation	—Unverified
SpanAlign: Efficient Sequence Tagging Annotation Projection into Translated Data applied to Cross-Lingual Opinion Mining	Nov 1, 2021	Data AugmentationMachine Translation	—Unverified
TermMind: Alibaba’s WMT21 Machine Translation Using Terminologies Task Submission	Nov 1, 2021	Data AugmentationMachine Translation	—Unverified
Contrastive Learning for Context-aware Neural Machine Translation Using Coreference Information	Nov 1, 2021	Contrastive Learningcoreference-resolution	—Unverified
The LMU Munich System for the WMT 2021 Large-Scale Multilingual Machine Translation Shared Task	Nov 1, 2021	Data AugmentationKnowledge Distillation	—Unverified
PDALN: Progressive Domain Adaptation over a Pre-trained Model for Low-Resource Cross-Domain Named Entity Recognition	Nov 1, 2021	Cross-Domain Named Entity RecognitionData Augmentation	—Unverified
How to Select One Among All ? An Empirical Study Towards the Robustness of Knowledge Distillation in Natural Language Understanding	Nov 1, 2021	Adversarial RobustnessAll	—Unverified
A New Tool for Efficiently Generating Quality Estimation Datasets	Nov 1, 2021	Data AugmentationDataset Generation	—Unverified
Can We Improve Model Robustness through Secondary Attribute Counterfactuals?	Nov 1, 2021	Attributecoreference-resolution	—Unverified
Semantics-Preserved Data Augmentation for Aspect-Based Sentiment Analysis	Nov 1, 2021	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	—Unverified
Are Factuality Checkers Reliable? Adversarial Meta-evaluation of Factuality in Summarization	Nov 1, 2021	Data AugmentationDiagnostic	CodeCode Available
Transductive Data Augmentation with Relational Path Rule Mining for Knowledge Graph Embedding	Nov 1, 2021	Data AugmentationGraph Embedding	—Unverified
Gradient-Based Adversarial Factual Consistency Evaluation for Abstractive Summarization	Nov 1, 2021	Abstractive Text SummarizationData Augmentation	—Unverified
CVAE-based Re-anchoring for Implicit Discourse Relation Classification	Nov 1, 2021	Binary ClassificationClassification	—Unverified
NVIDIA NeMo’s Neural Machine Translation Systems for English-German and English-Russian News and Biomedical Tasks at WMT21	Nov 1, 2021	Data AugmentationKnowledge Distillation	—Unverified
“Be nice to your wife! The restaurants are closed”: Can Gender Stereotype Detection Improve Sexism Classification?	Nov 1, 2021	ClassificationData Augmentation	—Unverified
Learning Data Augmentation Schedules for Natural Language Processing	Nov 1, 2021	Data AugmentationScheduling	CodeCode Available
Improving Dialogue State Tracking with Turn-based Loss Function and Sequential Data Augmentation	Nov 1, 2021	Data AugmentationDialogue State Tracking	CodeCode Available
A Semantic Feature-Wise Transformation Relation Network for Automatic Short Answer Grading	Nov 1, 2021	automatic short answer gradingData Augmentation	—Unverified
Sequence Mixup for Zero-Shot Cross-Lingual Part-Of-Speech Tagging	Nov 1, 2021	Cross-Lingual TransferData Augmentation	—Unverified
HW-TSC’s Participation at WMT 2021 Quality Estimation Shared Task	Nov 1, 2021	AllData Augmentation	—Unverified
Unsupervised Paraphrasing Consistency Training for Low Resource Named Entity Recognition	Nov 1, 2021	Data AugmentationLow Resource Named Entity Recognition	—Unverified
Can Question Generation Debias Question Answering Models? A Case Study on Question–Context Lexical Overlap	Nov 1, 2021	Data AugmentationQuestion Answering	—Unverified
Simulating Realistic MRI variations to Improve Deep Learning model and visual explanations using GradCAM	Nov 1, 2021	AnatomyBrain landmark detection	CodeCode Available
Long Term Stock Prediction based on Financial Statements	Nov 1, 2021	Data AugmentationPrediction	CodeCode Available
Reinforced Counterfactual Data Augmentation for Dual Sentiment Classification	Nov 1, 2021	Classificationcounterfactual	CodeCode Available

Show:10 25 50

← PrevPage 117 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified