Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2051–2100 of 8378 papers

Title	Date	Tasks	Status	Hype
Interpretable Solutions for Breast Cancer Diagnosis with Grammatical Evolution and Data Augmentation	Jan 25, 2024	Data AugmentationSynthetic Data Generation	—Unverified	0
Integrating Large Language Models into Recommendation via Mutual Augmentation and Adaptive Aggregation	Jan 25, 2024	Data Augmentation	—Unverified	0
Diffusion-based Data Augmentation for Object Counting Problems	Jan 25, 2024	Crowd CountingData Augmentation	—Unverified	0
Language Modelling Approaches to Adaptive Machine Translation	Jan 25, 2024	Data AugmentationDomain Adaptation	—Unverified	0
Machine Learning in Proton Exchange Membrane Water Electrolysis -- Part I: A Knowledge-Integrated Framework	Jan 24, 2024	Data Augmentation	—Unverified	0
Can GPT-3.5 Generate and Code Discharge Summaries?	Jan 24, 2024	Data Augmentation	CodeCode Available	0
Catch-Up Mix: Catch-Up Class for Struggling Filters in CNN	Jan 24, 2024	Data AugmentationImage Augmentation	—Unverified	0
NIV-SSD: Neighbor IoU-Voting Single-Stage Object Detector From Point Cloud	Jan 23, 2024	ClassificationData Augmentation	CodeCode Available	0
On Building Myopic MPC Policies using Supervised Learning	Jan 23, 2024	Data AugmentationModel Predictive Control	—Unverified	0
IndiText Boost: Text Augmentation for Low Resource India Languages	Jan 23, 2024	Data AugmentationMulti Class Text Classification	—Unverified	0
Towards Better Inclusivity: A Diverse Tweet Corpus of English Varieties	Jan 21, 2024	Data Augmentation	CodeCode Available	0
Closing the Gap between TD Learning and Supervised Learning -- A Generalisation Point of View	Jan 20, 2024	Data AugmentationReinforcement Learning (RL)	CodeCode Available	1
Spatial Scaper: A Library to Simulate and Augment Soundscapes for Sound Event Localization and Detection in Realistic Rooms	Jan 19, 2024	Data AugmentationDiversity	CodeCode Available	2
Data Augmentation for Traffic Classification	Jan 19, 2024	BenchmarkingClassification	—Unverified	0
Exploring Color Invariance through Image-Level Ensemble Learning	Jan 19, 2024	Data AugmentationEnsemble Learning	CodeCode Available	2
SAGE-HB: Swift Adaptation and Generalization in Massive MIMO Hybrid Beamforming	Jan 19, 2024	Data AugmentationDomain Adaptation	—Unverified	0
Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data	Jan 19, 2024	Data AugmentationDepth Estimation	CodeCode Available	9
Interplay of Semantic Communication and Knowledge Learning	Jan 18, 2024	Data AugmentationKnowledge Graphs	—Unverified	0
Learning High-Quality and General-Purpose Phrase Representations	Jan 18, 2024	Contrastive LearningData Augmentation	CodeCode Available	1
Analyzing and Mitigating Bias for Vulnerable Classes: Towards Balanced Representation in Dataset	Jan 18, 2024	Autonomous DrivingData Augmentation	—Unverified	0
ContextMix: A context-aware data augmentation method for industrial visual inspection systems	Jan 18, 2024	Data AugmentationObject Recognition	CodeCode Available	0
Simple and effective data augmentation for compositional generalization	Jan 18, 2024	Data Augmentation	—Unverified	0
Few-shot learning for COVID-19 Chest X-Ray Classification with Imbalanced Data: An Inter vs. Intra Domain Study	Jan 18, 2024	Data AugmentationFew-Shot Learning	CodeCode Available	0
Boosting Few-Shot Segmentation via Instance-Aware Data Augmentation and Local Consensus Guided Cross Attention	Jan 18, 2024	Data AugmentationSegmentation	—Unverified	0
Through the Dual-Prism: A Spectral Perspective on Graph Data Augmentation for Graph Classification	Jan 18, 2024	Data AugmentationGraph Classification	CodeCode Available	0
Self-supervised New Activity Detection in Sensor-based Smart Environments	Jan 17, 2024	Action DetectionActivity Detection	—Unverified	0
SymTC: A Symbiotic Transformer-CNN Net for Instance Segmentation of Lumbar Spine MRI	Jan 17, 2024	Data AugmentationImage Segmentation	CodeCode Available	1
On the Effect of Data-Augmentation on Local Embedding Properties in the Contrastive Learning of Music Audio Representations	Jan 17, 2024	Contrastive LearningData Augmentation	—Unverified	0
Trapped in texture bias? A large scale comparison of deep instance segmentation	Jan 17, 2024	Data AugmentationInstance Segmentation	CodeCode Available	1
Similar but Faster: Manipulation of Tempo in Music Audio Embeddings for Tempo Prediction and Search	Jan 17, 2024	Data AugmentationRetrieval	—Unverified	0
Efficient Training of Generalizable Visuomotor Policies via Control-Aware Augmentation	Jan 17, 2024	Data AugmentationReinforcement Learning (RL)	—Unverified	0
Augmenting Ground-Level PM2.5 Prediction via Kriging-Based Pseudo-Label Generation	Jan 16, 2024	Data AugmentationPseudo Label	—Unverified	0
A Deep Hierarchical Feature Sparse Framework for Occluded Person Re-Identification	Jan 15, 2024	Data AugmentationKnowledge Distillation	—Unverified	0
Authorship Obfuscation in Multilingual Machine-Generated Text Detection	Jan 15, 2024	Adversarial RobustnessBenchmarking	CodeCode Available	2
Enhanced Few-Shot Class-Incremental Learning via Ensemble Models	Jan 14, 2024	class-incremental learningClass Incremental Learning	—Unverified	0
Contrastive Learning with Negative Sampling Correction	Jan 13, 2024	Contrastive LearningData Augmentation	—Unverified	0
UniVision: A Unified Framework for Vision-Centric 3D Perception	Jan 13, 2024	Autonomous DrivingData Augmentation	CodeCode Available	0
Large Language Models Can Learn Temporal Reasoning	Jan 12, 2024	Data AugmentationDiversity	CodeCode Available	2
Maximum-Entropy Adversarial Audio Augmentation for Keyword Spotting	Jan 12, 2024	Computational EfficiencyData Augmentation	—Unverified	0
Local Gamma Augmentation for Ischemic Stroke Lesion Segmentation on MRI	Jan 12, 2024	Data AugmentationIschemic Stroke Lesion Segmentation	—Unverified	0
Effects of diversity incentives on sample diversity and downstream model performance in LLM-based text augmentation	Jan 12, 2024	Data AugmentationDiversity	CodeCode Available	0
Adaptive Data Augmentation for Aspect Sentiment Quad Prediction	Jan 12, 2024	Aspect-Based Sentiment AnalysisData Augmentation	CodeCode Available	0
Enhancing Personality Recognition in Dialogue by Data Augmentation and Heterogeneous Conversational Graph Networks	Jan 11, 2024	Data Augmentation	CodeCode Available	0
Chain of History: Learning and Forecasting with LLMs for Temporal Knowledge Graph Completion	Jan 11, 2024	Data AugmentationKnowledge Graph Completion	—Unverified	0
Evaluating Data Augmentation Techniques for Coffee Leaf Disease Classification	Jan 11, 2024	ClassificationData Augmentation	—Unverified	0
Knowledge Translation: A New Pathway for Model Compression	Jan 11, 2024	Data Augmentationmodel	CodeCode Available	0
Learning Generalizable Models via Disentangling Spurious and Enhancing Potential Correlations	Jan 11, 2024	Data AugmentationDomain Generalization	—Unverified	0
Dual-Perspective Knowledge Enrichment for Semi-Supervised 3D Object Detection	Jan 10, 2024	3D Object DetectionData Augmentation	CodeCode Available	0
Content-Conditioned Generation of Stylized Free hand Sketches	Jan 9, 2024	Data AugmentationImage Generation	—Unverified	0
Phase-shifted remote photoplethysmography for estimating heart rate and blood pressure from facial video	Jan 9, 2024	Data Augmentation	CodeCode Available	1

Show:10 25 50

← PrevPage 42 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified