Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 951–1000 of 8378 papers

Title	Date	Tasks	Status	Hype
Augmentation Policy Generation for Image Classification Using Large Language Models	Oct 17, 2024	Data Augmentationimage-classification	—Unverified	0
Deep Generative Models Unveil Patterns in Medical Images Through Vision-Language Conditioning	Oct 17, 2024	Data AugmentationImage Generation	CodeCode Available	0
Computational Approaches to Arabic-English Code-Switching	Oct 17, 2024	Data AugmentationLanguage Identification	—Unverified	0
Diffusion Curriculum: Synthetic-to-Real Generative Curriculum Learning via Image-Guided Diffusion	Oct 17, 2024	Data AugmentationImage Generation	CodeCode Available	1
REFINE on Scarce Data: Retrieval Enhancement through Fine-Tuning via Model Fusion of Embedding Models	Oct 16, 2024	Data AugmentationLanguage Modeling	—Unverified	0
A Survey on Data Synthesis and Augmentation for Large Language Models	Oct 16, 2024	Data Augmentation	—Unverified	0
Long-Tailed Backdoor Attack Using Dynamic Data Augmentation Operations	Oct 16, 2024	Backdoor AttackData Augmentation	—Unverified	0
Reinforcement Learning with Euclidean Data Augmentation for State-Based Continuous Control	Oct 16, 2024	continuous-controlContinuous Control	CodeCode Available	0
Comparative Analysis of Extrinsic Factors for NER in French	Oct 16, 2024	Data Augmentationnamed-entity-recognition	—Unverified	0
SDI-Paste: Synthetic Dynamic Instance Copy-Paste for Video Instance Segmentation	Oct 16, 2024	Data AugmentationInstance Segmentation	—Unverified	0
Synthetic Augmentation for Anatomical Landmark Localization using DDPMs	Oct 16, 2024	Data AugmentationDenoising	—Unverified	0
Feature Augmentation for Self-supervised Contrastive Learning: A Closer Look	Oct 16, 2024	Contrastive LearningData Augmentation	—Unverified	0
Xeno-learning: knowledge transfer across species in deep learning-based spectral image analysis	Oct 15, 2024	Data AugmentationTransfer Learning	—Unverified	0
AIC CTU system at AVeriTeC: Re-framing automated fact-checking as a simple RAG task	Oct 15, 2024	Data AugmentationFact Checking	CodeCode Available	0
YOLO-ELA: Efficient Local Attention Modeling for High-Performance Real-Time Insulator Defect Detection	Oct 15, 2024	Data AugmentationDefect Detection	—Unverified	0
Optimizing Encoder-Only Transformers for Session-Based Recommendation Systems	Oct 15, 2024	Data AugmentationRecommendation Systems	—Unverified	0
Efficient and Effective Universal Adversarial Attack against Vision-Language Pre-training Models	Oct 15, 2024	Adversarial AttackData Augmentation	—Unverified	0
Towards Fair Graph Representation Learning in Social Networks	Oct 15, 2024	Data AugmentationFairness	—Unverified	0
Time Series Viewmakers for Robust Disruption Prediction	Oct 14, 2024	Data AugmentationPrediction	—Unverified	0
Graph Masked Autoencoder for Spatio-Temporal Graph Learning	Oct 14, 2024	Crime PredictionData Augmentation	—Unverified	0
Fake it till you predict it: data augmentation strategies to detect initiation and termination of oncology treatment	Oct 14, 2024	Data Augmentation	—Unverified	0
Use Random Selection for Now: Investigation of Few-Shot Selection Strategies in LLM-based Text Augmentation for Classification	Oct 14, 2024	Data AugmentationFew-Shot Learning	CodeCode Available	0
Joint Mixing Data Augmentation for Skeleton-based Action Recognition	Oct 13, 2024	Action RecognitionData Augmentation	CodeCode Available	0
Diabetic retinopathy image classification method based on GreenBen data augmentation	Oct 12, 2024	ClassificationData Augmentation	—Unverified	0
Use of What-if Scenarios to Help Explain Artificial Intelligence Models for Neonatal Health	Oct 12, 2024	counterfactualData Augmentation	CodeCode Available	0
Intent-Enhanced Data Augmentation for Sequential Recommendation	Oct 11, 2024	Contrastive LearningData Augmentation	—Unverified	0
HpEIS: Learning Hand Pose Embeddings for Multimedia Interactive Systems	Oct 11, 2024	Data Augmentation	—Unverified	0
MYCROFT: Towards Effective and Efficient External Data Augmentation	Oct 11, 2024	Data Augmentation	—Unverified	0
A Target-Aware Analysis of Data Augmentation for Hate Speech Detection	Oct 10, 2024	Data AugmentationHate Speech Detection	—Unverified	0
The Effects of Hallucinations in Synthetic Training Data for Relation Extraction	Oct 10, 2024	Data AugmentationKnowledge Graphs	—Unverified	0
Minority-Focused Text-to-Image Generation via Prompt Optimization	Oct 10, 2024	Data AugmentationImage Generation	CodeCode Available	1
Disease Entity Recognition and Normalization is Improved with Large Language Model Derived Synthetic Normalized Mentions	Oct 10, 2024	Data AugmentationKnowledge Graphs	—Unverified	0
Explainability of Deep Neural Networks for Brain Tumor Detection	Oct 10, 2024	Data AugmentationDecision Making	CodeCode Available	0
Unsupervised Data Validation Methods for Efficient Model Training	Oct 10, 2024	Data Augmentationmodel	—Unverified	0
Data Augmentation for Surgical Scene Segmentation with Anatomy-Aware Diffusion Models	Oct 10, 2024	AnatomyData Augmentation	CodeCode Available	0
Offline Inverse Constrained Reinforcement Learning for Safe-Critical Decision Making in Healthcare	Oct 10, 2024	Common Sense ReasoningData Augmentation	—Unverified	0
When and Where Did it Happen? An Encoder-Decoder Model to Identify Scenario Context	Oct 10, 2024	Data AugmentationDecoder	CodeCode Available	0
TinyClick: Single-Turn Agent for Empowering GUI Automation	Oct 9, 2024	Data AugmentationGPU	—Unverified	0
Zero-Shot Generalization of Vision-Based RL Without Data Augmentation	Oct 9, 2024	Data AugmentationDisentanglement	—Unverified	0
CSSL: Contrastive Self-Supervised Learning for Dependency Parsing on Relatively Free Word Ordered and Morphologically Rich Low Resource Languages	Oct 9, 2024	Data AugmentationDependency Parsing	—Unverified	0
MaskBlur: Spatial and Angular Data Augmentation for Light Field Image Super-Resolution	Oct 9, 2024	Data AugmentationDeblurring	CodeCode Available	0
Transesophageal Echocardiography Generation using Anatomical Models	Oct 9, 2024	Data AugmentationSemantic Segmentation	—Unverified	0
Clean Evaluations on Contaminated Visual Language Models	Oct 9, 2024	Data Augmentation	—Unverified	0
ELMO: Enhanced Real-time LiDAR Motion Capture through Upsampling	Oct 9, 2024	Data Augmentation	—Unverified	0
Improving Data Augmentation-based Cross-Speaker Style Transfer for TTS with Singing Voice, Style Filtering, and F0 Matching	Oct 8, 2024	Data AugmentationStyle Transfer	CodeCode Available	4
Adaptive Label Smoothing for Out-of-Distribution Detection	Oct 8, 2024	Data AugmentationOut-of-Distribution Detection	—Unverified	0
SymDiff: Equivariant Diffusion via Stochastic Symmetrisation	Oct 8, 2024	Data Augmentation	—Unverified	0
Learning Gaussian Data Augmentation in Feature Space for One-shot Object Detection in Manga	Oct 8, 2024	ColorizationData Augmentation	—Unverified	0
HumVI: A Multilingual Dataset for Detecting Violent Incidents Impacting Humanitarian Aid	Oct 8, 2024	ArticlesData Augmentation	CodeCode Available	0
Collapsed Language Models Promote Fairness	Oct 6, 2024	Data AugmentationFairness	CodeCode Available	0

Show:10 25 50

← PrevPage 20 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified