Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5551–5600 of 8378 papers

Title	Date	Tasks	Status
NeuroMixGDP: A Neural Collapse-Inspired Random Mixup for Private Data Release	Feb 14, 2022	Data AugmentationPrivacy Preserving	CodeCode Available
Adversarial Graph Contrastive Learning with Information Regularization	Feb 14, 2022	Contrastive LearningData Augmentation	CodeCode Available
LMN at SemEval-2022 Task 11: A Transformer-based System for English Named Entity Recognition	Feb 13, 2022	Data AugmentationEntity Linking	—Unverified
Distribution augmentation for low-resource expressive text-to-speech	Feb 13, 2022	Data AugmentationDiversity	—Unverified
A Data Augmentation Method for Fully Automatic Brain Tumor Segmentation	Feb 13, 2022	Brain Tumor SegmentationData Augmentation	—Unverified
Fast Adversarial Training with Noise Augmentation: A Unified Perspective on RandStart and GradAlign	Feb 11, 2022	Data Augmentation	—Unverified
FrAUG: A Frame Rate Based Data Augmentation Method for Depression Detection from Speech Signals	Feb 11, 2022	Data AugmentationDepression Detection	—Unverified
Audio Defect Detection in Music with Deep Networks	Feb 11, 2022	Data AugmentationDecoder	—Unverified
HaT5: Hate Language Identification using Text-to-Text Transfer Transformer	Feb 11, 2022	Data AugmentationExplainable artificial intelligence	—Unverified
A Deep Learning Approach for Digital Color Reconstruction of Lenticular Films	Feb 10, 2022	ColorizationData Augmentation	—Unverified
Adults as Augmentations for Children in Facial Emotion Recognition with Contrastive Learning	Feb 10, 2022	Contrastive LearningData Augmentation	—Unverified
Feature-level augmentation to improve robustness of deep neural networks to affine transformations	Feb 10, 2022	Data Augmentationimage-classification	—Unverified
Cross-speaker style transfer for text-to-speech using data augmentation	Feb 10, 2022	Data AugmentationStyle Transfer	—Unverified
A multiscale spatiotemporal approach for smallholder irrigation detection	Feb 9, 2022	Data Augmentation	—Unverified
Fault Detection and Diagnosis with Imbalanced and Noisy Data: A Hybrid Framework for Rotating Machinery	Feb 9, 2022	Data AugmentationFault Detection	—Unverified
Social Media as an Instant Source of Feedback on Water Quality	Feb 9, 2022	Data Augmentation	—Unverified
The Volcspeech system for the ICASSP 2022 multi-channel multi-party meeting transcription challenge	Feb 9, 2022	Data AugmentationLanguage Modelling	—Unverified
TransformNet: Self-supervised representation learning through predicting geometric transformations	Feb 8, 2022	Data Augmentationimage-classification	CodeCode Available
Equivariance versus Augmentation for Spherical Images	Feb 8, 2022	Data Augmentationimage-classification	CodeCode Available
DeepSSN: a deep convolutional neural network to assess spatial scene similarity	Feb 7, 2022	Data AugmentationInformation Retrieval	CodeCode Available
Field-of-View IoU for Object Detection in 360° Images	Feb 7, 2022	Data AugmentationERP	—Unverified
SODA: Self-organizing data augmentation in deep neural networks -- Application to biomedical image segmentation tasks	Feb 7, 2022	Data AugmentationImage Segmentation	—Unverified
Maximizing Audio Event Detection Model Performance on Small Datasets Through Knowledge Transfer, Data Augmentation, And Pretraining: An Ablation Study	Feb 7, 2022	Data AugmentationEvent Detection	—Unverified
Multi-modal data generation with a deep metric variational autoencoder	Feb 7, 2022	Data AugmentationTriplet	—Unverified
LiDAR dataset distillation within bayesian active learning framework: Understanding the effect of data augmentation	Feb 6, 2022	Active LearningAutonomous Driving	—Unverified
Exemplar-Based Contrastive Self-Supervised Learning with Few-Shot Class Incremental Learning	Feb 5, 2022	class-incremental learningClass Incremental Learning	—Unverified
Fairness for Text Classification Tasks with Identity Information Data Augmentation Methods	Feb 4, 2022	counterfactualData Augmentation	—Unverified
The CUHK-TENCENT speaker diarization system for the ICASSP 2022 multi-channel multi-party meeting transcription challenge	Feb 4, 2022	Action DetectionActivity Detection	—Unverified
Multi-Output Gaussian Process-Based Data Augmentation for Multi-Building and Multi-Floor Indoor Localization	Feb 4, 2022	Data AugmentationIndoor Localization	—Unverified
Bootstrapped Representation Learning for Skeleton-Based Action Recognition	Feb 4, 2022	Action RecognitionData Augmentation	—Unverified
A benchmark of state-of-the-art sound event detection systems evaluated on synthetic soundscapes	Feb 3, 2022	Data AugmentationEvent Detection	—Unverified
The RoyalFlush System of Speech Recognition for M2MeT Challenge	Feb 3, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Learning Mechanically Driven Emergent Behavior with Message Passing Neural Networks	Feb 3, 2022	BIG-bench Machine LearningData Augmentation	CodeCode Available
NoisyMix: Boosting Model Robustness to Common Corruptions	Feb 2, 2022	Data Augmentationmodel	—Unverified
Generalizability of Machine Learning Models: Quantitative Evaluation of Three Methodological Pitfalls	Feb 1, 2022	BIG-bench Machine LearningData Augmentation	—Unverified
Deep Learning in fNIRS: A review	Jan 31, 2022	Brain Computer InterfaceClassification	—Unverified
Compositionality as Lexical Symmetry	Jan 30, 2022	Data AugmentationInductive Bias	CodeCode Available
Improving Robustness by Enhancing Weak Subnets	Jan 30, 2022	Adversarial RobustnessData Augmentation	CodeCode Available
Efficient Embedding of Semantic Similarity in Control Policies via Entangled Bisimulation	Jan 28, 2022	Data AugmentationReinforcement Learning (RL)	—Unverified
Improving End-to-End Models for Set Prediction in Spoken Language Understanding	Jan 28, 2022	Data AugmentationDecoder	—Unverified
Systematic Investigation of Strategies Tailored for Low-Resource Settings for Low-Resource Dependency Parsing	Jan 27, 2022	Data AugmentationDependency Parsing	CodeCode Available
Synthesizing Dysarthric Speech Using Multi-talker TTS for Dysarthric Speech Recognition	Jan 27, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Tackling data scarcity in speech translation using zero-shot multilingual machine translation techniques	Jan 26, 2022	Data AugmentationMachine Translation	CodeCode Available
Recency Dropout for Recurrent Recommender Systems	Jan 26, 2022	Data AugmentationRecommendation Systems	—Unverified
Challenges and Opportunities for Machine Learning Classification of Behavior and Mental State from Images	Jan 26, 2022	Active LearningBIG-bench Machine Learning	—Unverified
Cardiac Disease Diagnosis on Imbalanced Electrocardiography Data Through Optimal Transport Augmentation	Jan 25, 2022	Data Augmentation	—Unverified
Feature transforms for image data augmentation	Jan 24, 2022	Data Augmentationimage-classification	CodeCode Available
Synthetic speech detection using meta-learning with prototypical loss	Jan 24, 2022	Data AugmentationMeta-Learning	—Unverified
A Novel Mix-normalization Method for Generalizable Multi-source Person Re-identification	Jan 24, 2022	Data AugmentationPerson Re-Identification	—Unverified
On-Device Learning with Cloud-Coordinated Data Augmentation for Extreme Model Personalization in Recommender Systems	Jan 24, 2022	Data AugmentationRecommendation Systems	—Unverified

Show:10 25 50

← PrevPage 112 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified