Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6401–6450 of 8378 papers

Title	Date	Tasks	Status
Semi-supervised Interactive Intent Labeling	Apr 27, 2021	ClusteringData Augmentation	—Unverified
Machine Learning Algorithms for Breast Cancer Detection in Mammography Images: A Comparative Study	Apr 26, 2021	Breast Cancer DetectionCancer-no cancer per image classification	—Unverified
Semantic Data Augmentation for End-to-End Mandarin Speech Recognition	Apr 26, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Accuracy Improvement for Fully Convolutional Networks via Selective Augmentation with Applications to Electrocardiogram Data	Apr 25, 2021	Data AugmentationGeneral Classification	—Unverified
Automatic Diagnosis of COVID-19 from CT Images using CycleGAN and Transfer Learning	Apr 24, 2021	Computed Tomography (CT)Data Augmentation	—Unverified
DeepMix: Online Auto Data Augmentation for Robust Visual Object Tracking	Apr 23, 2021	Data AugmentationObject	—Unverified
Disfluency Detection with Unlabeled Data and Small BERT Models	Apr 21, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Exploring 2D Data Augmentation for 3D Monocular Object Detection	Apr 21, 2021	2D Object Detection3D geometry	—Unverified
TITAN: T Cell Receptor Specificity Prediction with Bimodal Attention Networks	Apr 21, 2021	Data AugmentationSpecificity	—Unverified
PALI at SemEval-2021 Task 2: Fine-Tune XLM-RoBERTa for Word in Context Disambiguation	Apr 21, 2021	Data AugmentationTAG	—Unverified
GAN-Based Data Augmentation and Anonymization for Skin-Lesion Analysis: A Critical Review	Apr 20, 2021	Data Augmentation	CodeCode Available
Boosting Masked Face Recognition with Multi-Task ArcFace	Apr 20, 2021	Data AugmentationFace Recognition	—Unverified
Does enhanced shape bias improve neural network robustness to common corruptions?	Apr 20, 2021	Data Augmentation	—Unverified
Automatic Stroke Classification of Tabla Accompaniment in Hindustani Vocal Concert Audio	Apr 19, 2021	Data AugmentationGeneral Classification	—Unverified
Estimating Traffic Speeds using Probe Data: A Deep Neural Network Approach	Apr 19, 2021	Data Augmentation	—Unverified
A Competitive Method to VIPriors Object Detection Challenge	Apr 19, 2021	Data AugmentationObject	—Unverified
Machine-learning-based head impact subtyping based on the spectral densities of the measurable head kinematics	Apr 19, 2021	Data AugmentationGeneral Classification	—Unverified
Few-shot learning via tensor hallucination	Apr 19, 2021	Data AugmentationFew-Shot Learning	CodeCode Available
On Training Sketch Recognizers for New Domains	Apr 18, 2021	Data AugmentationSketch Recognition	—Unverified
Combining a Convolutional Neural Network with Autoencoders to Predict the Survival Chance of COVID-19 Patients	Apr 18, 2021	Data Augmentation	—Unverified
Best Practices for Noise-Based Augmentation to Improve the Performance of Deployable Speech-Based Emotion Recognition Systems	Apr 18, 2021	Adversarial AttackAutomatic Speech Recognition	—Unverified
Color Variants Identification in Fashion e-commerce via Contrastive Self-Supervised Representation Learning	Apr 17, 2021	Data AugmentationRepresentation Learning	—Unverified
Sentence Concatenation Approach to Data Augmentation for Neural Machine Translation	Apr 17, 2021	Data AugmentationMachine Translation	—Unverified
Age Range Estimation using MTCNN and VGG-Face Model	Apr 17, 2021	Data AugmentationFace Model	—Unverified
Hierarchical Topic Presence Models	Apr 16, 2021	Data AugmentationTopic Models	—Unverified
Open data for Moroccan license plates for OCR applications : data collection, labeling, and model construction	Apr 16, 2021	Data AugmentationLicense Plate Recognition	—Unverified
Data Augmentation for Voice-Assistant NLU using BERT-based Interchangeable Rephrase	Apr 16, 2021	Data Augmentationintent-classification	—Unverified
EnvGAN: Adversarial Synthesis of Environmental Sounds for Data Augmentation	Apr 15, 2021	Data AugmentationEnvironmental Sound Classification	—Unverified
On the Robustness of Intent Classification and Slot Labeling in Goal-oriented Dialog Systems to Real-world Noise	Apr 14, 2021	Data AugmentationGoal-Oriented Dialog	CodeCode Available
Multilingual Transfer Learning for Code-Switched Language and Speech Neural Modeling	Apr 13, 2021	Data AugmentationLanguage Modelling	—Unverified
Can a Transformer Pass the Wug Test? Tuning Copying Bias in Neural Morphological Inflection Models	Apr 13, 2021	Data AugmentationHallucination	—Unverified
Generalization bounds via distillation	Apr 12, 2021	Data AugmentationGeneralization Bounds	—Unverified
Exploring Geometric Consistency for Monocular 3D Object Detection	Apr 12, 2021	3D Object DetectionAutonomous Driving	—Unverified
Noether: The More Things Change, the More Stay the Same	Apr 12, 2021	Data Augmentation	—Unverified
Constructing Contrastive samples via Summarization for Text Classification with limited annotations	Apr 11, 2021	Contrastive LearningData Augmentation	CodeCode Available
ALT-MAS: A Data-Efficient Framework for Active Testing of Machine Learning Algorithms	Apr 11, 2021	BIG-bench Machine LearningData Augmentation	—Unverified
The NTNU Taiwanese ASR System for Formosa Speech Recognition Challenge 2020	Apr 9, 2021	Data AugmentationSpeech Enhancement	—Unverified
RaidaR: A Rich Annotated Image Dataset of Rainy Street Scenes	Apr 9, 2021	Autonomous DrivingData Augmentation	—Unverified
Robust Training of Social Media Image Classification Models for Rapid Disaster Response	Apr 9, 2021	Data AugmentationDisaster Response	—Unverified
Exploring Machine Speech Chain for Domain Adaptation and Few-Shot Speaker Adaptation	Apr 8, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Lone Pine at SemEval-2021 Task 5: Fine-Grained Detection of Hate Speech Using BERToxic	Apr 8, 2021	Data AugmentationToxic Spans Detection	CodeCode Available
Handling Climate Change Using Counterfactuals: Using Counterfactuals in Data Augmentation to Predict Crop Growth in an Uncertain Climate Future	Apr 8, 2021	counterfactualData Augmentation	—Unverified
Analysis Towards Classification of Infection and Ischaemia of Diabetic Foot Ulcers	Apr 7, 2021	Data AugmentationGeneral Classification	—Unverified
Correlation Sketches for Approximate Join-Correlation Queries	Apr 7, 2021	Data Augmentation	—Unverified
Bootstrapping Your Own Positive Sample: Contrastive Learning With Electronic Health Record Data	Apr 7, 2021	AttributeContrastive Learning	—Unverified
Track, Check, Repeat: An EM Approach to Unsupervised Tracking	Apr 7, 2021	Data AugmentationObject Discovery	—Unverified
Generalization of GANs and overparameterized models under Lipschitz continuity	Apr 6, 2021	Data AugmentationGeneralization Bounds	—Unverified
Achieving Domain Generalization in Underwater Object Detection by Domain Mixup and Contrastive Learning	Apr 6, 2021	Contrastive LearningData Augmentation	—Unverified
Personalized Speech Enhancement through Self-Supervised Data Augmentation and Purification	Apr 5, 2021	Data AugmentationDenoising	—Unverified
On-the-Fly Aligned Data Augmentation for Sequence-to-Sequence ASR	Apr 3, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available

Show:10 25 50

← PrevPage 129 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified