Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5951–6000 of 8378 papers

Title	Date	Tasks	Status	Hype
DeepMix: Online Auto Data Augmentation for Robust Visual Object Tracking	Apr 23, 2021	Data AugmentationObject	—Unverified	0
TITAN: T Cell Receptor Specificity Prediction with Bimodal Attention Networks	Apr 21, 2021	Data AugmentationSpecificity	—Unverified	0
Disfluency Detection with Unlabeled Data and Small BERT Models	Apr 21, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Exploring 2D Data Augmentation for 3D Monocular Object Detection	Apr 21, 2021	2D Object Detection3D geometry	—Unverified	0
PALI at SemEval-2021 Task 2: Fine-Tune XLM-RoBERTa for Word in Context Disambiguation	Apr 21, 2021	Data AugmentationTAG	—Unverified	0
GAN-Based Data Augmentation and Anonymization for Skin-Lesion Analysis: A Critical Review	Apr 20, 2021	Data Augmentation	CodeCode Available	0
Boosting Masked Face Recognition with Multi-Task ArcFace	Apr 20, 2021	Data AugmentationFace Recognition	—Unverified	0
Does enhanced shape bias improve neural network robustness to common corruptions?	Apr 20, 2021	Data Augmentation	—Unverified	0
Estimating Traffic Speeds using Probe Data: A Deep Neural Network Approach	Apr 19, 2021	Data Augmentation	—Unverified	0
Automatic Stroke Classification of Tabla Accompaniment in Hindustani Vocal Concert Audio	Apr 19, 2021	Data AugmentationGeneral Classification	—Unverified	0
Machine-learning-based head impact subtyping based on the spectral densities of the measurable head kinematics	Apr 19, 2021	Data AugmentationGeneral Classification	—Unverified	0
A Competitive Method to VIPriors Object Detection Challenge	Apr 19, 2021	Data AugmentationObject	—Unverified	0
ECACL: A Holistic Framework for Semi-Supervised Domain Adaptation	Apr 19, 2021	Data AugmentationDomain Adaptation	CodeCode Available	1
Few-shot learning via tensor hallucination	Apr 19, 2021	Data AugmentationFew-Shot Learning	CodeCode Available	0
GPT3Mix: Leveraging Large-scale Language Models for Text Augmentation	Apr 18, 2021	Data AugmentationGeneral Classification	CodeCode Available	1
Combining a Convolutional Neural Network with Autoencoders to Predict the Survival Chance of COVID-19 Patients	Apr 18, 2021	Data Augmentation	—Unverified	0
On Training Sketch Recognizers for New Domains	Apr 18, 2021	Data AugmentationSketch Recognition	—Unverified	0
Best Practices for Noise-Based Augmentation to Improve the Performance of Deployable Speech-Based Emotion Recognition Systems	Apr 18, 2021	Adversarial AttackAutomatic Speech Recognition	—Unverified	0
SimCSE: Simple Contrastive Learning of Sentence Embeddings	Apr 18, 2021	Contrastive LearningData Augmentation	CodeCode Available	2
A Full Text-Dependent End to End Mispronunciation Detection and Diagnosis with Easy Data Augmentation Techniques	Apr 17, 2021	Data Augmentation	CodeCode Available	1
Sentence Concatenation Approach to Data Augmentation for Neural Machine Translation	Apr 17, 2021	Data AugmentationMachine Translation	—Unverified	0
Color Variants Identification in Fashion e-commerce via Contrastive Self-Supervised Representation Learning	Apr 17, 2021	Data AugmentationRepresentation Learning	—Unverified	0
Age Range Estimation using MTCNN and VGG-Face Model	Apr 17, 2021	Data AugmentationFace Model	—Unverified	0
Hierarchical Topic Presence Models	Apr 16, 2021	Data AugmentationTopic Models	—Unverified	0
Data Augmentation for Voice-Assistant NLU using BERT-based Interchangeable Rephrase	Apr 16, 2021	Data Augmentationintent-classification	—Unverified	0
Open data for Moroccan license plates for OCR applications : data collection, labeling, and model construction	Apr 16, 2021	Data AugmentationLicense Plate Recognition	—Unverified	0
EnvGAN: Adversarial Synthesis of Environmental Sounds for Data Augmentation	Apr 15, 2021	Data AugmentationEnvironmental Sound Classification	—Unverified	0
A Simple Baseline for Semi-supervised Semantic Segmentation with Strong Data Augmentation	Apr 15, 2021	Data Augmentationimage-classification	CodeCode Available	1
On the Robustness of Intent Classification and Slot Labeling in Goal-oriented Dialog Systems to Real-world Noise	Apr 14, 2021	Data AugmentationGoal-Oriented Dialog	CodeCode Available	0
Representative Forgery Mining for Fake Face Detection	Apr 14, 2021	Data AugmentationFace Detection	CodeCode Available	1
Multilingual Transfer Learning for Code-Switched Language and Speech Neural Modeling	Apr 13, 2021	Data AugmentationLanguage Modelling	—Unverified	0
Can a Transformer Pass the Wug Test? Tuning Copying Bias in Neural Morphological Inflection Models	Apr 13, 2021	Data AugmentationHallucination	—Unverified	0
Exploring Geometric Consistency for Monocular 3D Object Detection	Apr 12, 2021	3D Object DetectionAutonomous Driving	—Unverified	0
Generalization bounds via distillation	Apr 12, 2021	Data AugmentationGeneralization Bounds	—Unverified	0
Neural Camera Simulators	Apr 12, 2021	Data Augmentation	CodeCode Available	1
Noether: The More Things Change, the More Stay the Same	Apr 12, 2021	Data Augmentation	—Unverified	0
Self-supervised Multi-view Stereo via Effective Co-Segmentation and Data-Augmentation	Apr 12, 2021	Data Augmentation	CodeCode Available	1
Fruit Quality and Defect Image Classification with Conditional GAN Data Augmentation	Apr 12, 2021	ClassificationData Augmentation	CodeCode Available	1
Constructing Contrastive samples via Summarization for Text Classification with limited annotations	Apr 11, 2021	Contrastive LearningData Augmentation	CodeCode Available	0
Raindrops on Windshield: Dataset and Lightweight Gradient-Based Detection Algorithm	Apr 11, 2021	Autonomous VehiclesData Augmentation	CodeCode Available	1
ALT-MAS: A Data-Efficient Framework for Active Testing of Machine Learning Algorithms	Apr 11, 2021	BIG-bench Machine LearningData Augmentation	—Unverified	0
RaidaR: A Rich Annotated Image Dataset of Rainy Street Scenes	Apr 9, 2021	Autonomous DrivingData Augmentation	—Unverified	0
The NTNU Taiwanese ASR System for Formosa Speech Recognition Challenge 2020	Apr 9, 2021	Data AugmentationSpeech Enhancement	—Unverified	0
Robust Training of Social Media Image Classification Models for Rapid Disaster Response	Apr 9, 2021	Data AugmentationDisaster Response	—Unverified	0
Direct Differentiable Augmentation Search	Apr 9, 2021	AutoMLData Augmentation	CodeCode Available	1
Handling Climate Change Using Counterfactuals: Using Counterfactuals in Data Augmentation to Predict Crop Growth in an Uncertain Climate Future	Apr 8, 2021	counterfactualData Augmentation	—Unverified	0
Exploring Machine Speech Chain for Domain Adaptation and Few-Shot Speaker Adaptation	Apr 8, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Lone Pine at SemEval-2021 Task 5: Fine-Grained Detection of Hate Speech Using BERToxic	Apr 8, 2021	Data AugmentationToxic Spans Detection	CodeCode Available	0
CutPaste: Self-Supervised Learning for Anomaly Detection and Localization	Apr 8, 2021	Anomaly ClassificationAnomaly Detection	CodeCode Available	1
Analysis Towards Classification of Infection and Ischaemia of Diabetic Foot Ulcers	Apr 7, 2021	Data AugmentationGeneral Classification	—Unverified	0

Show:10 25 50

← PrevPage 120 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified