Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8001–8050 of 8378 papers

Title	Date	Tasks	Status
T5 for Hate Speech, Augmented Data and Ensemble	Oct 11, 2022	Data AugmentationExplainable artificial intelligence	CodeCode Available
Evaluating data augmentation for financial time series classification	Oct 28, 2020	ClassificationData Augmentation	CodeCode Available
Consistency of augmentation graph and network approximability in contrastive learning	Feb 6, 2025	Contrastive LearningData Augmentation	CodeCode Available
Conjugate Bayesian Two-step Change Point Detection for Hawkes Process	Sep 26, 2024	Change Point DetectionComputational Efficiency	CodeCode Available
Conditional Infilling GANs for Data Augmentation in Mammogram Classification	Jul 21, 2018	Breast Cancer DetectionCancer Classification	CodeCode Available
Adversarial Word Dilution as Text Data Augmentation in Low-Resource Regime	May 16, 2023	ClassificationData Augmentation	CodeCode Available
OLISIA: a Cascade System for Spoken Dialogue State Tracking	Apr 20, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Equivariant Contrastive Learning for Sequential Recommendation	Nov 10, 2022	Contrastive LearningData Augmentation	CodeCode Available
Conditional Generation from Unconditional Diffusion Models using Denoiser Representations	Jun 2, 2023	AttributeData Augmentation	CodeCode Available
Equivariance versus Augmentation for Spherical Images	Feb 8, 2022	Data Augmentationimage-classification	CodeCode Available
OMR: Occlusion-Aware Memory-Based Refinement for Video Lane Detection	Aug 14, 2024	Data AugmentationLane Detection	CodeCode Available
EPINET: A Fully-Convolutional Neural Network Using Epipolar Geometry for Depth from Light Field Images	Apr 6, 2018	Data AugmentationDepth Estimation	CodeCode Available
On Automatic Data Augmentation for 3D Point Cloud Classification	Dec 11, 2021	3D Object Classification3D Object Recognition	CodeCode Available
TabAug: Data Driven Augmentation for Enhanced Table Structure Recognition	Apr 29, 2021	Data Augmentation	CodeCode Available
Conditional Distribution Learning on Graphs	Nov 20, 2024	Contrastive LearningData Augmentation	CodeCode Available
Conditional BERT Contextual Augmentation	Dec 17, 2018	Data AugmentationLanguage Modeling	CodeCode Available
Augmented SBERT: Data Augmentation Method for Improving Bi-Encoders for Pairwise Sentence Scoring Tasks	Oct 16, 2020	Data AugmentationDomain Adaptation	CodeCode Available
Table-based Fact Verification with Salience-aware Learning	Sep 9, 2021	counterfactualData Augmentation	CodeCode Available
Ensembles provably learn equivariance through data augmentation	Oct 2, 2024	Data Augmentation	CodeCode Available
Towards Robustifying NLI Models Against Lexical Dataset Biases	May 10, 2020	Data AugmentationNatural Language Inference	CodeCode Available
TabMDA: Tabular Manifold Data Augmentation for Any Classifier using Transformers with In-context Subsetting	Jun 3, 2024	Data Augmentation	CodeCode Available
Ensemble Augmentation for Deep Neural Networks Using 1-D Time Series Vibration Data	Aug 6, 2021	Data AugmentationGenerative Adversarial Network	CodeCode Available
Graph Component Contrastive Learning for Concept Relatedness Estimation	Jun 25, 2022	Contrastive LearningData Augmentation	CodeCode Available
Augmented Balanced Image Dataset Generator Using AugStatic Library	May 1, 2022	ClassificationData Augmentation	CodeCode Available
Compositionality as Lexical Symmetry	Jan 30, 2022	Data AugmentationInductive Bias	CodeCode Available
Enriching GNNs with Text Contextual Representations for Detecting Disinformation Campaigns on Social Media	Oct 24, 2024	Data AugmentationFake News Detection	CodeCode Available
One Node One Model: Featuring the Missing-Half for Graph Clustering	Dec 13, 2024	ClusteringData Augmentation	CodeCode Available
Comparative Knowledge Distillation	Nov 3, 2023	Data AugmentationKnowledge Distillation	CodeCode Available
Enriched Long-term Recurrent Convolutional Network for Facial Micro-Expression Recognition	May 22, 2018	Data AugmentationMicro Expression Recognition	CodeCode Available
DICE: Device-level Integrated Circuits Encoder with Graph Contrastive Pretraining	Feb 13, 2025	Contrastive LearningData Augmentation	CodeCode Available
Enriched BERT Embeddings for Scholarly Publication Classification	May 7, 2024	ArticlesClassification	CodeCode Available
One-Shot Segmentation of Novel White Matter Tracts via Extensive Data Augmentation	Mar 13, 2023	Data AugmentationOne-Shot Segmentation	CodeCode Available
Enhancing Visual Perception in Novel Environments via Incremental Data Augmentation Based on Style Transfer	Sep 16, 2023	Anomaly DetectionData Augmentation	CodeCode Available
Enhancing TinyBERT for Financial Sentiment Analysis Using GPT-Augmented FinBERT Distillation	Sep 19, 2024	Data AugmentationEdge-computing	CodeCode Available
Community-Based Hierarchical Positive-Unlabeled (PU) Model Fusion for Chronic Disease Prediction	Sep 6, 2023	Binary ClassificationData Augmentation	CodeCode Available
Enhancing Sequence-to-Sequence Neural Lemmatization with External Resources	Jan 28, 2021	Data AugmentationDecoder	CodeCode Available
Combining Denoising Autoencoders with Contrastive Learning to fine-tune Transformer Models	May 23, 2024	Contrastive LearningData Augmentation	CodeCode Available
Enhancing Robustness of AI Offensive Code Generators via Data Augmentation	Jun 8, 2023	Data AugmentationDiversity	CodeCode Available
Enhancing Psychotherapy Counseling: A Data Augmentation Pipeline Leveraging Large Language Models for Counseling Conversations	Jun 13, 2024	Data Augmentation	CodeCode Available
Enhancing Personality Recognition in Dialogue by Data Augmentation and Heterogeneous Conversational Graph Networks	Jan 11, 2024	Data Augmentation	CodeCode Available
On the Effectiveness of Hybrid Pooling in Mixup-Based Graph Learning for Language Processing	Oct 6, 2022	Code ClassificationData Augmentation	CodeCode Available
Combining Contrastive and Supervised Learning for Video Super-Resolution Detection	May 20, 2022	Data AugmentationSuper-Resolution	CodeCode Available
Colorful Cutout: Enhancing Image Data Augmentation with Curriculum Learning	Mar 29, 2024	Data Augmentation	CodeCode Available
Tackling Data Bias in Painting Classification with Style Transfer	Jan 6, 2023	ClassificationData Augmentation	CodeCode Available
Tackling data scarcity in speech translation using zero-shot multilingual machine translation techniques	Jan 26, 2022	Data AugmentationMachine Translation	CodeCode Available
ColloQL: Robust Text-to-SQL Over Search Queries	Nov 1, 2020	Data AugmentationText to SQL	CodeCode Available
Self-supervised Learning for Panoptic Segmentation of Multiple Fruit Flower Species	Sep 10, 2022	Data AugmentationInstance Segmentation	CodeCode Available
U-NetPlus: A Modified Encoder-Decoder U-Net Architecture for Semantic and Instance Segmentation of Surgical Instrument	Feb 24, 2019	Data AugmentationDecoder	CodeCode Available
ColloQL: Robust Cross-Domain Text-to-SQL Over Search Queries	Oct 19, 2020	Data AugmentationText to SQL	CodeCode Available
Tackling Irony Detection using Ensemble Classifiers	Jun 1, 2022	Binary ClassificationData Augmentation	CodeCode Available

Show:10 25 50

← PrevPage 161 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified