Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1351–1400 of 8378 papers

Title	Date	Tasks	Status	Hype
Invariance Principle Meets Vicinal Risk Minimization	Jul 8, 2024	Data AugmentationDiversity	—Unverified	0
Bringing Masked Autoencoders Explicit Contrastive Properties for Point Cloud Self-Supervised Learning	Jul 8, 2024	Contrastive LearningData Augmentation	CodeCode Available	0
LLaMAX: Scaling Linguistic Horizons of LLM by Enhancing Translation Capabilities Beyond 100 Languages	Jul 8, 2024	Data AugmentationTranslation	CodeCode Available	2
InverseCoder: Self-improving Instruction-Tuned Code LLMs with Inverse-Instruct	Jul 8, 2024	Code GenerationCode Summarization	CodeCode Available	1
Fine-Grained and Interpretable Neural Speech Editing	Jul 7, 2024	Data AugmentationSpeech Synthesis	CodeCode Available	1
Diffusion as Sound Propagation: Physics-inspired Model for Ultrasound Image Generation	Jul 7, 2024	Data AugmentationImage Generation	CodeCode Available	1
On the power of data augmentation for head pose estimation	Jul 7, 2024	Data AugmentationFace Alignment	CodeCode Available	1
SmurfCat at PAN 2024 TextDetox: Alignment of Multilingual Transformers for Text Detoxification	Jul 7, 2024	Data AugmentationMachine Translation	CodeCode Available	0
Enhanced Long-Tailed Recognition with Contrastive CutMix Augmentation	Jul 6, 2024	Contrastive LearningData Augmentation	CodeCode Available	0
Conditional Semi-Supervised Data Augmentation for Spam Message Detection with Low Resource Data	Jul 6, 2024	Data AugmentationSpam detection	—Unverified	0
Synthetic Data Aided Federated Learning Using Foundation Models	Jul 6, 2024	Data AugmentationFederated Learning	—Unverified	0
TimeLDM: Latent Diffusion Model for Unconditional Time Series Generation	Jul 5, 2024	Autonomous DrivingData Augmentation	—Unverified	0
LLMAEL: Large Language Models are Good Context Augmenters for Entity Linking	Jul 4, 2024	Data AugmentationEntity Linking	CodeCode Available	1
Improving Accented Speech Recognition using Data Augmentation based on Unsupervised Text-to-Speech Synthesis	Jul 4, 2024	Accented Speech RecognitionAutomatic Speech Recognition	—Unverified	0
DSMix: Distortion-Induced Sensitivity Map Based Pre-training for No-Reference Image Quality Assessment	Jul 4, 2024	Data AugmentationImage Quality Assessment	CodeCode Available	0
Query-oriented Data Augmentation for Session Search	Jul 4, 2024	Data AugmentationSession Search	—Unverified	0
Generative Technology for Human Emotion Recognition: A Scope Review	Jul 4, 2024	Data AugmentationEmotional Intelligence	—Unverified	0
Leveraging Latent Diffusion Models for Training-Free In-Distribution Data Augmentation for Surface Defect Detection	Jul 4, 2024	Data AugmentationDefect Detection	CodeCode Available	1
A Survey of Data Synthesis Approaches	Jul 4, 2024	Data AugmentationDiversity	CodeCode Available	0
Advances in Diffusion Models for Image Data Augmentation: A Review of Methods, Models, Evaluation Metrics and Future Research Directions	Jul 4, 2024	Data AugmentationDiversity	—Unverified	0
DACB-Net: Dual Attention Guided Compact Bilinear Convolution Neural Network for Skin Disease Classification	Jul 3, 2024	Data AugmentationTransfer Learning	—Unverified	0
Boosting Biomedical Concept Extraction by Rule-Based Data Augmentation	Jul 3, 2024	Data Augmentation	—Unverified	0
Self-supervised Vision Transformer are Scalable Generative Models for Domain Generalization	Jul 3, 2024	Color NormalizationData Augmentation	CodeCode Available	0
HRSAM: Efficient Interactive Segmentation in High-Resolution Images	Jul 2, 2024	Data AugmentationGPU	CodeCode Available	1
Rethinking Data Augmentation for Robust LiDAR Semantic Segmentation in Adverse Weather	Jul 2, 2024	Data AugmentationLIDAR Semantic Segmentation	CodeCode Available	2
Ensemble of pre-trained language models and data augmentation for hate speech detection from Arabic tweets	Jul 2, 2024	Data AugmentationEnsemble Learning	—Unverified	0
Are Data Augmentation Methods in Named Entity Recognition Applicable for Uncertainty Estimation?	Jul 2, 2024	Data Augmentationnamed-entity-recognition	CodeCode Available	0
Counterfactual Data Augmentation with Denoising Diffusion for Graph Anomaly Detection	Jul 2, 2024	Anomaly Detectioncounterfactual	CodeCode Available	0
Evaluating the Role of Data Enrichment Approaches Towards Rare Event Analysis in Manufacturing	Jul 1, 2024	Data AugmentationEvent Detection	—Unverified	0
Robust and Reliable Early-Stage Website Fingerprinting Attacks via Spatial-Temporal Distribution Analysis	Jul 1, 2024	Contrastive LearningData Augmentation	CodeCode Available	2
Improving Trip Mode Choice Modeling Using Ensemble Synthesizer (ENSY)	Jul 1, 2024	ClassificationData Augmentation	—Unverified	0
SGCCNet: Single-Stage 3D Object Detector With Saliency-Guided Data Augmentation and Confidence Correction Mechanism	Jul 1, 2024	Data Augmentation	—Unverified	0
Analyzing Persuasive Strategies in Meme Texts: A Fusion of Language Models with Paraphrase Enrichment	Jul 1, 2024	Data AugmentationDiversity	—Unverified	0
Gloss2Text: Sign Language Gloss translation using LLMs and Semantically Aware Label Smoothing	Jul 1, 2024	Data AugmentationSign Language Translation	CodeCode Available	0
Channel Modeling Aided Dataset Generation for AI-Enabled CSI Feedback: Advances, Challenges, and Solutions	Jul 1, 2024	Data AugmentationDataset Generation	—Unverified	0
SAFE: a SAR Feature Extractor based on self-supervised learning and masked Siamese ViTs	Jun 30, 2024	Change DetectionContrastive Learning	CodeCode Available	0
Heterogeneous Graph Contrastive Learning with Spectral Augmentation	Jun 30, 2024	Contrastive LearningData Augmentation	—Unverified	0
Iterative Data Generation with Large Language Models for Aspect-based Sentiment Analysis	Jun 29, 2024	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	—Unverified	0
LLM-Generated Natural Language Meets Scaling Laws: New Explorations and Data Augmentation Methods	Jun 29, 2024	Data AugmentationFew-Shot Text Classification	—Unverified	0
A Survey on Deep Clustering: From the Prior Perspective	Jun 28, 2024	ClusteringData Augmentation	—Unverified	0
Mining Reasons For And Against Vaccination From Unstructured Data Using Nichesourcing and AI Data Augmentation	Jun 28, 2024	Data AugmentationIn-Context Learning	—Unverified	0
Exact Bayesian Gaussian Cox Processes Using Random Integral	Jun 28, 2024	Data AugmentationPoint Processes	CodeCode Available	0
Multi-Epoch learning with Data Augmentation for Deep Click-Through Rate Prediction	Jun 27, 2024	Click-Through Rate PredictionContinual Learning	—Unverified	0
UniGen: A Unified Framework for Textual Dataset Generation Using Large Language Models	Jun 27, 2024	AttributeBenchmarking	CodeCode Available	2
RoFIR: Robust Fisheye Image Rectification Framework Impervious to Optical Center Deviation	Jun 27, 2024	Data AugmentationLocal Distortion	—Unverified	0
Zero-shot domain adaptation based on dual-level mix and contrast	Jun 27, 2024	Contrastive LearningData Augmentation	—Unverified	0
Sequential Disentanglement by Extracting Static Information From A Single Sequence Element	Jun 26, 2024	Data AugmentationDisentanglement	—Unverified	0
Effects of Using Synthetic Data on Deep Recommender Models' Performance	Jun 26, 2024	Data AugmentationRecommendation Systems	—Unverified	0
VIPriors 4: Visual Inductive Priors for Data-Efficient Deep Learning Challenges	Jun 26, 2024	Data AugmentationDeep Learning	—Unverified	0
RouteLLM: Learning to Route LLMs with Preference Data	Jun 26, 2024	Data AugmentationTransfer Learning	CodeCode Available	7

Show:10 25 50

← PrevPage 28 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified