Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1251–1300 of 8378 papers

Title	Date	Tasks	Status	Hype	Score
BSUV-Net: A Fully-Convolutional Neural Network forBackground Subtraction of Unseen Videos	Jan 14, 2020	Data AugmentationObject Tracking	CodeCode Available	1	5
LiteNeXt: A Novel Lightweight ConvMixer-based Model with Self-embedding Representation Parallel for Medical Image Segmentation	Apr 4, 2024	Data AugmentationDecoder	CodeCode Available	1	5
Generative Data Augmentation for Aspect Sentiment Quad Prediction	Jul 1, 2023	Aspect-Based Sentiment Analysis (ABSA)Data Augmentation	CodeCode Available	1	5
Data augmentation for learning predictive models on EEG: a systematic comparison	Jun 29, 2022	Data AugmentationEEG	CodeCode Available	1	5
A Competitive Method for Dog Nose-print Re-identification	May 31, 2022	Data AugmentationTriplet	CodeCode Available	1	5
Data Augmentation for Meta-Learning	Oct 14, 2020	Data AugmentationMeta-Learning	CodeCode Available	1	5
Data Augmentation for Supervised Graph Outlier Detection via Latent Diffusion Models	Dec 29, 2023	Data AugmentationDenoising	CodeCode Available	1	5
Local Additivity Based Data Augmentation for Semi-supervised NER	Oct 4, 2020	Data Augmentationnamed-entity-recognition	CodeCode Available	1	5
Data Augmentation for Scene Text Recognition	Aug 16, 2021	Data AugmentationImage Augmentation	CodeCode Available	1	5
Data Augmentation for Spoken Language Understanding via Pretrained Language Models	Apr 29, 2020	Data AugmentationSpoken Language Understanding	CodeCode Available	1	5
Automated Chest CT Image Segmentation of COVID-19 Lung Infection based on 3D U-Net	Jun 24, 2020	Data AugmentationImage Segmentation	CodeCode Available	1	5
Look Beneath the Surface: Exploiting Fundamental Symmetry for Sample-Efficient Offline RL	Jun 7, 2023	Data AugmentationOffline RL	CodeCode Available	1	5
An Accurate Car Counting in Aerial Images Based on Convolutional Neural Networks	Jul 13, 2021	Data AugmentationObject Counting	CodeCode Available	1	5
MaDi: Learning to Mask Distractions for Generalization in Visual Deep Reinforcement Learning	Dec 23, 2023	Data AugmentationDeep Reinforcement Learning	CodeCode Available	1	5
Boosted Neural Decoders: Achieving Extreme Reliability of LDPC Codes for 6G Networks	May 22, 2024	Data AugmentationDecoder	CodeCode Available	1	5
Data Augmentation in High Dimensional Low Sample Size Setting Using a Geometry-Based Variational Autoencoder	Apr 30, 2021	Data AugmentationSpecificity	CodeCode Available	1	5
Data Augmentation of Wearable Sensor Data for Parkinson's Disease Monitoring using Convolutional Neural Networks	Jun 2, 2017	ClassificationData Augmentation	CodeCode Available	1	5
MaGNET: Uniform Sampling from Deep Generative Network Manifolds Without Retraining	Oct 15, 2021	Data AugmentationDomain Adaptation	CodeCode Available	1	5
Data Augmentation on Graphs: A Technical Survey	Dec 20, 2022	Data AugmentationGraph Representation Learning	CodeCode Available	1	5
MambaPupil: Bidirectional Selective Recurrent model for Event-based Eye tracking	Apr 18, 2024	Data AugmentationDiversity	CodeCode Available	1	5
Data Augmentation using Pre-trained Transformer Models	Mar 4, 2020	Data AugmentationDiversity	CodeCode Available	1	5
MARIO: Model Agnostic Recipe for Improving OOD Generalization of Graph Contrastive Learning	Jul 24, 2023	Contrastive LearningData Augmentation	CodeCode Available	1	5
Masked Autoencoders are Robust Data Augmentors	Jun 10, 2022	Data AugmentationImage Augmentation	CodeCode Available	1	5
Masked Thought: Simply Masking Partial Reasoning Steps Can Improve Mathematical Reasoning Learning of Language Models	Mar 4, 2024	Data AugmentationGSM8K	CodeCode Available	1	5
An Investigation of End-to-End Models for Robust Speech Recognition	Feb 11, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1	5
MATE-KD: Masked Adversarial TExt, a Companion to Knowledge Distillation	May 12, 2021	Adversarial TextData Augmentation	CodeCode Available	1	5
Maximum-Entropy Adversarial Data Augmentation for Improved Generalization and Robustness	Oct 15, 2020	Data Augmentation	CodeCode Available	1	5
MaxStyle: Adversarial Style Composition for Robust Medical Image Segmentation	Jun 2, 2022	Data AugmentationDecoder	CodeCode Available	1	5
CADTransformer: Panoptic Symbol Spotting Transformer for CAD Drawings	Jan 1, 2022	Data Augmentation	CodeCode Available	1	5
Data Augmentation with norm-VAE for Unsupervised Domain Adaptation	Dec 1, 2020	Data AugmentationDomain Adaptation	CodeCode Available	1	5
AnnoCTR: A Dataset for Detecting and Linking Entities, Tactics, and Techniques in Cyber Threat Reports	Apr 11, 2024	Data Augmentation	CodeCode Available	1	5
Data augmentation with Mobius transformations	Feb 7, 2020	Data AugmentationTranslation	CodeCode Available	1	5
Meta-optimized Contrastive Learning for Sequential Recommendation	Apr 16, 2023	Contrastive LearningData Augmentation	CodeCode Available	1	5
MetaSAug: Meta Semantic Augmentation for Long-Tailed Visual Recognition	Mar 23, 2021	Data AugmentationImage Classification	CodeCode Available	1	5
Metric Based Few-Shot Graph Classification	Jun 8, 2022	ClassificationData Augmentation	CodeCode Available	1	5
Data Augmenting Contrastive Learning of Speech Representations in the Time Domain	Jul 2, 2020	Contrastive LearningData Augmentation	CodeCode Available	1	5
Genie: A Generator of Natural Language Semantic Parsers for Virtual Assistant Commands	Apr 18, 2019	Data AugmentationTranslation	CodeCode Available	1	5
Global Pooling, More than Meets the Eye: Position Information is Encoded Channel-Wise in CNNs	Aug 17, 2021	Data AugmentationPosition	CodeCode Available	1	5
Minority-Focused Text-to-Image Generation via Prompt Optimization	Oct 10, 2024	Data AugmentationImage Generation	CodeCode Available	1	5
MinPrompt: Graph-based Minimal Prompt Data Augmentation for Few-shot Question Answering	Oct 8, 2023	Data AugmentationQuestion Answering	CodeCode Available	1	5
Data-Efficient Instance Generation from Instance Discrimination	Jun 8, 2021	2kData Augmentation	CodeCode Available	1	5
Data-Efficient Reinforcement Learning with Self-Predictive Representations	Jul 12, 2020	Atari Games 100kData Augmentation	CodeCode Available	1	5
DiffAug: Enhance Unsupervised Contrastive Learning with Domain-Knowledge-Free Diffusion-based Data Augmentation	Sep 10, 2023	Contrastive LearningData Augmentation	CodeCode Available	1	5
BOOTPLACE: Bootstrapped Object Placement with Detection Transformers	Mar 27, 2025	Data AugmentationObject	CodeCode Available	1	5
Generation of Realistic Synthetic Raw Radar Data for Automated Driving Applications using Generative Adversarial Networks	Aug 4, 2023	Data AugmentationEdge Detection	CodeCode Available	1	5
DAVINCI: A Single-Stage Architecture for Constrained CAD Sketch Inference	Oct 30, 2024	Data Augmentation	CodeCode Available	1	5
Data Optimization in Deep Learning: A Survey	Oct 25, 2023	Data AugmentationDeep Learning	CodeCode Available	1	5
Bootstrapping Relation Extractors using Syntactic Search by Examples	Feb 9, 2021	Data AugmentationRelation	CodeCode Available	1	5
Data set creation and empirical analysis for detecting signs of depression from social media postings	Feb 7, 2022	Data Augmentation	CodeCode Available	1	5
Generation of microbial colonies dataset with deep learning style transfer	Nov 6, 2021	Data AugmentationDeep Learning	CodeCode Available	1	5

Show:10 25 50

← PrevPage 26 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified