Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1901–1950 of 8378 papers

Title	Date	Tasks	Status	Hype
AnatoMix: Anatomy-aware Data Augmentation for Multi-organ Segmentation	Mar 5, 2024	AnatomyData Augmentation	—Unverified	0
False Positive Sampling-based Data Augmentation for Enhanced 3D Object Detection Accuracy	Mar 5, 2024	3D Object DetectionData Augmentation	—Unverified	0
Data Augmentation using Large Language Models: Data Perspectives, Learning Paradigms and Challenges	Mar 5, 2024	Data AugmentationSurvey	—Unverified	0
Emergent Equivariance in Deep Ensembles	Mar 5, 2024	AllData Augmentation	—Unverified	0
Enhancing Generalization in Medical Visual Question Answering Tasks via Gradient-Guided Model Perturbation	Mar 5, 2024	Data AugmentationMedical Visual Question Answering	—Unverified	0
FedHCDR: Federated Cross-Domain Recommendation with Hypergraph Signal Decoupling	Mar 5, 2024	Contrastive LearningData Augmentation	CodeCode Available	1
A Generative Model of Symmetry Transformations	Mar 4, 2024	Data Augmentationmodel	CodeCode Available	0
AS-ES Learning: Towards Efficient CoT Learning in Small Models	Mar 4, 2024	Data AugmentationLogical Reasoning	—Unverified	0
Fourier-basis Functions to Bridge Augmentation Gap: Rethinking Frequency Augmentation in Image Classification	Mar 4, 2024	Data Augmentationimage-classification	CodeCode Available	1
Masked Thought: Simply Masking Partial Reasoning Steps Can Improve Mathematical Reasoning Learning of Language Models	Mar 4, 2024	Data AugmentationGSM8K	CodeCode Available	1
Bayesian Uncertainty Estimation by Hamiltonian Monte Carlo: Applications to Cardiac MRI Segmentation	Mar 4, 2024	Data AugmentationImage Segmentation	—Unverified	0
Fine Tuning vs. Retrieval Augmented Generation for Less Popular Knowledge	Mar 3, 2024	Data AugmentationQuestion Answering	CodeCode Available	0
Multi-level Product Category Prediction through Text Classification	Mar 3, 2024	ClassificationData Augmentation	CodeCode Available	0
Self-Supervised Representation Learning with Meta Comprehensive Regularization	Mar 3, 2024	counterfactualData Augmentation	—Unverified	0
ShapeBoost: Boosting Human Shape Estimation with Part-Based Parameterization and Clothing-Preserving Augmentation	Mar 2, 2024	Data Augmentation	—Unverified	0
OpenGraph: Towards Open Graph Foundation Models	Mar 2, 2024	Data AugmentationGraph Learning	CodeCode Available	3
The Impact of Frequency Bands on Acoustic Anomaly Detection of Machines using Deep Learning Based Model	Mar 1, 2024	Anomaly DetectionData Augmentation	—Unverified	0
Improving Socratic Question Generation using Data Augmentation and Preference Optimization	Mar 1, 2024	Data AugmentationQuestion Generation	CodeCode Available	0
Fractal interpolation in the context of prediction accuracy optimization	Mar 1, 2024	Data AugmentationPrediction	—Unverified	0
VisRec: A Semi-Supervised Approach to Radio Interferometric Data Reconstruction	Mar 1, 2024	Data Augmentation	—Unverified	0
Improving Android Malware Detection Through Data Augmentation Using Wasserstein Generative Adversarial Networks	Mar 1, 2024	Android Malware DetectionData Augmentation	—Unverified	0
MALTO at SemEval-2024 Task 6: Leveraging Synthetic Data for LLM Hallucination Detection	Mar 1, 2024	Data AugmentationHallucination	—Unverified	0
Binary Gaussian Copula Synthesis: A Novel Data Augmentation Technique to Advance ML-based Clinical Decision Support Systems for Early Prediction of Dialysis Among CKD Patients	Mar 1, 2024	Data Augmentation	—Unverified	0
Enhancing Protein Predictive Models via Proteins Data Augmentation: A Benchmark and New Directions	Mar 1, 2024	Data AugmentationSaliency Detection	—Unverified	0
Predicting UAV Type: An Exploration of Sampling and Data Augmentation for Time Series Classification	Mar 1, 2024	Data AugmentationTime Series	—Unverified	0
Learning to Find Missing Video Frames with Synthetic Data Augmentation: A General Framework and Application in Generating Thermal Images Using RGB Cameras	Feb 29, 2024	Data AugmentationImage Generation	—Unverified	0
Assessing Visually-Continuous Corruption Robustness of Neural Networks Relative to Human Performance	Feb 29, 2024	Data Augmentationimage-classification	—Unverified	0
StiefelGen: A Simple, Model Agnostic Approach for Time Series Data Augmentation over Riemannian Manifolds	Feb 29, 2024	Data AugmentationTime Series	—Unverified	0
WHU-Synthetic: A Synthetic Perception Dataset for 3-D Multitask Model Research	Feb 29, 2024	3D ReconstructionAttribute	CodeCode Available	1
A Modular System for Enhanced Robustness of Multimedia Understanding Networks via Deep Parametric Estimation	Feb 28, 2024	Data AugmentationDomain Adaptation	CodeCode Available	0
OccTransformer: Improving BEVFormer for 3D camera-only occupancy prediction	Feb 28, 2024	Autonomous DrivingData Augmentation	—Unverified	0
Data augmentation method for modeling health records with applications to clopidogrel treatment failure detection	Feb 28, 2024	Data Augmentation	—Unverified	0
Classes Are Not Equal: An Empirical Study on Image Recognition Fairness	Feb 28, 2024	Contrastive LearningData Augmentation	—Unverified	0
Robust Synthetic Data-Driven Detection of Living-Off-the-Land Reverse Shells	Feb 28, 2024	Data AugmentationSynthetic Data Generation	—Unverified	0
Why does music source separation benefit from cacophony?	Feb 28, 2024	Data AugmentationMusic Source Separation	—Unverified	0
3DSFLabelling: Boosting 3D Scene Flow Estimation by Pseudo Auto-labelling	Feb 28, 2024	Autonomous DrivingData Augmentation	CodeCode Available	1
Balancing Act: Distribution-Guided Debiasing in Diffusion Models	Feb 28, 2024	AttributeData Augmentation	—Unverified	0
FSL-Rectifier: Rectify Outliers in Few-Shot Learning via Test-Time Augmentation	Feb 28, 2024	Data AugmentationFew-Shot Learning	CodeCode Available	0
How we won BraTS 2023 Adult Glioma challenge? Just faking it! Enhanced Synthetic Data Augmentation and Model Ensemble for brain tumour segmentation	Feb 27, 2024	Data AugmentationDeep Learning	—Unverified	0
Mitigating Distributional Shift in Semantic Segmentation via Uncertainty Estimation from Unlabelled Data	Feb 27, 2024	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Read and Think: An Efficient Step-wise Multimodal Language Model for Document Understanding and Reasoning	Feb 26, 2024	Data Augmentationdocument understanding	—Unverified	0
Towards Explainability and Fairness in Swiss Judgement Prediction: Benchmarking on a Multilingual Dataset	Feb 26, 2024	BenchmarkingCross-Lingual Transfer	—Unverified	0
CodeS: Towards Building Open-source Language Models for Text-to-SQL	Feb 26, 2024	Data AugmentationDiagnostic	CodeCode Available	2
LLM-based Privacy Data Augmentation Guided by Knowledge Distillation with a Distribution Tutor for Medical Text Classification	Feb 26, 2024	Data AugmentationKnowledge Distillation	—Unverified	0
Generative AI in Vision: A Survey on Models, Metrics and Applications	Feb 26, 2024	Data AugmentationDenoising	—Unverified	0
A Poisson-Gamma Dynamic Factor Model with Time-Varying Transition Dynamics	Feb 26, 2024	Data AugmentationTime Series	—Unverified	0
Exploring the Power of Pure Attention Mechanisms in Blind Room Parameter Estimation	Feb 25, 2024	Data Augmentationparameter estimation	—Unverified	0
Attention-GAN for Anomaly Detection: A Cutting-Edge Approach to Cybersecurity Threat Management	Feb 25, 2024	Anomaly DetectionData Augmentation	—Unverified	0
NeSy is alive and well: A LLM-driven symbolic approach for better code comment data generation and classification	Feb 25, 2024	ClassificationData Augmentation	CodeCode Available	0
Leveraging ChatGPT in Pharmacovigilance Event Extraction: An Empirical Study	Feb 24, 2024	Data AugmentationEvent Extraction	CodeCode Available	0

Show:10 25 50

← PrevPage 39 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified