Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4351–4400 of 8378 papers

Title	Date	Tasks	Status	Hype
Masked Autoencoders are Robust Data Augmentors	Jun 10, 2022	Data AugmentationImage Augmentation	CodeCode Available	1
Is Self-Supervised Learning More Robust Than Supervised Learning?	Jun 10, 2022	Contrastive LearningData Augmentation	—Unverified	0
Heterogeneous Face Recognition via Face Synthesis with Identity-Attribute Disentanglement	Jun 10, 2022	AttributeData Augmentation	—Unverified	0
Extreme Masking for Learning Instance and Distributed Visual Representations	Jun 9, 2022	Data AugmentationRepresentation Learning	CodeCode Available	1
I'm Me, We're Us, and I'm Us: Tri-directional Contrastive Learning on Hypergraphs	Jun 9, 2022	Contrastive LearningData Augmentation	CodeCode Available	1
Beyond RGB: Scene-Property Synthesis with Neural Radiance Fields	Jun 9, 2022	Data AugmentationEdge Detection	—Unverified	0
Learn2Augment: Learning to Composite Videos for Data Augmentation in Action Recognition	Jun 9, 2022	Action RecognitionData Augmentation	—Unverified	0
BSM loss: A superior way in modeling aleatory uncertainty of fine_grained classification	Jun 9, 2022	Data AugmentationDiagnostic	—Unverified	0
PointNeXt: Revisiting PointNet++ with Improved Training and Scaling Strategies	Jun 9, 2022	3D Classification3D Part Segmentation	CodeCode Available	3
Metric Based Few-Shot Graph Classification	Jun 8, 2022	ClassificationData Augmentation	CodeCode Available	1
On gradient descent training under data augmentation with on-line noisy copies	Jun 8, 2022	Data Augmentationregression	—Unverified	0
Always Keep your Target in Mind: Studying Semantics and Improving Performance of Neural Lexical Substitution	Jun 7, 2022	Data AugmentationRelation Extraction	CodeCode Available	0
An efficient semi-supervised quality control system trained using physics-based MRI-artefact generators and adversarial training	Jun 7, 2022	Computational EfficiencyData Augmentation	—Unverified	0
Marvolo: Programmatic Data Augmentation for Practical ML-Driven Malware Detection	Jun 7, 2022	Data AugmentationMalware Detection	—Unverified	0
PP-OCRv3: More Attempts for the Improvement of Ultra Lightweight OCR System	Jun 7, 2022	Data AugmentationOptical Character Recognition	—Unverified	0
Mixed Graph Contrastive Network for Semi-Supervised Node Classification	Jun 6, 2022	ClassificationContrastive Learning	—Unverified	0
Global Mixup: Eliminating Ambiguity with Clustering	Jun 6, 2022	ClusteringData Augmentation	—Unverified	0
Stacked unsupervised learning with a network architecture found by supervised meta-learning	Jun 6, 2022	ClusteringData Augmentation	—Unverified	0
AugLoss: A Robust Augmentation-based Fine Tuning Methodology	Jun 5, 2022	Data Augmentation	—Unverified	0
Toward Learning Robust and Invariant Representations with Alignment Regularization and Data Augmentation	Jun 4, 2022	Data Augmentation	CodeCode Available	1
Monkeypox Image Data collection	Jun 3, 2022	Data Augmentation	CodeCode Available	1
Integrating Prior Knowledge in Contrastive Learning with Kernel	Jun 3, 2022	Contrastive LearningData Augmentation	CodeCode Available	0
Adversarial Unlearning: Reducing Confidence Along Adversarial Directions	Jun 3, 2022	Data Augmentation	—Unverified	0
YOLOv5s-GTB: light-weighted and improved YOLOv5s for bridge crack detection	Jun 3, 2022	Data AugmentationImage Classification	—Unverified	0
MaxStyle: Adversarial Style Composition for Robust Medical Image Segmentation	Jun 2, 2022	Data AugmentationDecoder	CodeCode Available	1
Is Mapping Necessary for Realistic PointGoal Navigation?	Jun 2, 2022	Data AugmentationNavigate	CodeCode Available	1
Long-tailed Recognition by Learning from Latent Categories	Jun 2, 2022	Data AugmentationDiversity	—Unverified	0
Data Augmentation for the Post-Stroke Speech Transcription (PSST) Challenge: Sometimes Less Is More	Jun 1, 2022	Data AugmentationLanguage Modeling	—Unverified	0
Glyph Features Matter: A Multimodal Solution for EvaHan in LT4HALA2022	Jun 1, 2022	Data AugmentationPart-Of-Speech Tagging	—Unverified	0
An Inflectional Database for Gitksan	Jun 1, 2022	Data AugmentationHallucination	CodeCode Available	0
Automatic Gloss-level Data Augmentation for Sign Language Translation	Jun 1, 2022	Data AugmentationSentence	—Unverified	0
Speech Data Augmentation for Improving Phoneme Transcriptions of Aphasic Speech Using Wav2Vec 2.0 for the PSST Challenge	Jun 1, 2022	Automatic Phoneme RecognitionData Augmentation	—Unverified	0
LuxemBERT: Simple and Practical Data Augmentation in Language Model Pre-Training for Luxembourgish	Jun 1, 2022	Data AugmentationLanguage Modeling	—Unverified	0
Data Augmentation for Low-resource Word Segmentation and POS Tagging of Ancient Chinese Texts	Jun 1, 2022	Data AugmentationLanguage Modeling	—Unverified	0
Tackling Irony Detection using Ensemble Classifiers	Jun 1, 2022	Binary ClassificationData Augmentation	CodeCode Available	0
Ancient Chinese Word Segmentation and Part-of-Speech Tagging Using Data Augmentation	Jun 1, 2022	Chinese Word SegmentationData Augmentation	—Unverified	0
eRock at Qur’an QA 2022: Contemporary Deep Neural Networks for Qur’an based Reading Comprehension Question Answers	Jun 1, 2022	Data AugmentationQuestion Answering	—Unverified	0
Fine-tuning of Convolutional Neural Networks for the Recognition of Facial Expressions in Sign Language Video Samples	Jun 1, 2022	Data AugmentationFacial Expression Recognition	—Unverified	0
Examining the Effects of Language-and-Vision Data Augmentation for Generation of Descriptions of Human Faces	Jun 1, 2022	Caption GenerationData Augmentation	—Unverified	0
A First Attempt at Unreliable News Detection in Swedish	Jun 1, 2022	ArticlesData Augmentation	—Unverified	0
Scaling up Discourse Quality Annotation for Political Science	Jun 1, 2022	Argument MiningData Augmentation	CodeCode Available	0
Effectiveness of Data Augmentation and Pretraining for Improving Neural Headline Generation in Low-Resource Settings	Jun 1, 2022	Data AugmentationDecoder	—Unverified	0
Mitigating Dataset Artifacts in Natural Language Inference Through Automatic Contextual Data Augmentation and Learning Optimization	Jun 1, 2022	Contrastive LearningData Augmentation	—Unverified	0
Exploring Text Recombination for Automatic Narrative Level Detection	Jun 1, 2022	Data AugmentationNatural Language Understanding	—Unverified	0
Exploring Data Augmentation Strategies for Hate Speech Detection in Roman Urdu	Jun 1, 2022	Data AugmentationHate Speech Detection	—Unverified	0
Data Expansion Using WordNet-based Semantic Expansion and Word Disambiguation for Cyberbullying Detection	Jun 1, 2022	Binary ClassificationData Augmentation	—Unverified	0
Rethinking the Augmentation Module in Contrastive Learning: Learning Hierarchical Augmentation Invariance with Expanded Views	Jun 1, 2022	Contrastive LearningData Augmentation	CodeCode Available	0
Order-sensitive Shapley Values for Evaluating Conceptual Soundness of NLP Models	Jun 1, 2022	Data AugmentationNegation	—Unverified	0
Point-Teaching: Weakly Semi-Supervised Object Detection with Point Annotations	Jun 1, 2022	Data AugmentationMultiple Instance Learning	—Unverified	0
Efficient Scheduling of Data Augmentation for Deep Reinforcement Learning	Jun 1, 2022	Data AugmentationDeep Reinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 88 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified