Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3251–3300 of 8378 papers

Title	Date	Tasks	Status
ShapeBoost: Boosting Human Shape Estimation with Part-Based Parameterization and Clothing-Preserving Augmentation	Mar 2, 2024	Data Augmentation	—Unverified
MALTO at SemEval-2024 Task 6: Leveraging Synthetic Data for LLM Hallucination Detection	Mar 1, 2024	Data AugmentationHallucination	—Unverified
Enhancing Protein Predictive Models via Proteins Data Augmentation: A Benchmark and New Directions	Mar 1, 2024	Data AugmentationSaliency Detection	—Unverified
Improving Android Malware Detection Through Data Augmentation Using Wasserstein Generative Adversarial Networks	Mar 1, 2024	Android Malware DetectionData Augmentation	—Unverified
Binary Gaussian Copula Synthesis: A Novel Data Augmentation Technique to Advance ML-based Clinical Decision Support Systems for Early Prediction of Dialysis Among CKD Patients	Mar 1, 2024	Data Augmentation	—Unverified
Fractal interpolation in the context of prediction accuracy optimization	Mar 1, 2024	Data AugmentationPrediction	—Unverified
The Impact of Frequency Bands on Acoustic Anomaly Detection of Machines using Deep Learning Based Model	Mar 1, 2024	Anomaly DetectionData Augmentation	—Unverified
Predicting UAV Type: An Exploration of Sampling and Data Augmentation for Time Series Classification	Mar 1, 2024	Data AugmentationTime Series	—Unverified
Improving Socratic Question Generation using Data Augmentation and Preference Optimization	Mar 1, 2024	Data AugmentationQuestion Generation	CodeCode Available
VisRec: A Semi-Supervised Approach to Radio Interferometric Data Reconstruction	Mar 1, 2024	Data Augmentation	—Unverified
StiefelGen: A Simple, Model Agnostic Approach for Time Series Data Augmentation over Riemannian Manifolds	Feb 29, 2024	Data AugmentationTime Series	—Unverified
Learning to Find Missing Video Frames with Synthetic Data Augmentation: A General Framework and Application in Generating Thermal Images Using RGB Cameras	Feb 29, 2024	Data AugmentationImage Generation	—Unverified
Assessing Visually-Continuous Corruption Robustness of Neural Networks Relative to Human Performance	Feb 29, 2024	Data Augmentationimage-classification	—Unverified
A Modular System for Enhanced Robustness of Multimedia Understanding Networks via Deep Parametric Estimation	Feb 28, 2024	Data AugmentationDomain Adaptation	CodeCode Available
Robust Synthetic Data-Driven Detection of Living-Off-the-Land Reverse Shells	Feb 28, 2024	Data AugmentationSynthetic Data Generation	—Unverified
OccTransformer: Improving BEVFormer for 3D camera-only occupancy prediction	Feb 28, 2024	Autonomous DrivingData Augmentation	—Unverified
Why does music source separation benefit from cacophony?	Feb 28, 2024	Data AugmentationMusic Source Separation	—Unverified
Classes Are Not Equal: An Empirical Study on Image Recognition Fairness	Feb 28, 2024	Contrastive LearningData Augmentation	—Unverified
FSL-Rectifier: Rectify Outliers in Few-Shot Learning via Test-Time Augmentation	Feb 28, 2024	Data AugmentationFew-Shot Learning	CodeCode Available
Balancing Act: Distribution-Guided Debiasing in Diffusion Models	Feb 28, 2024	AttributeData Augmentation	—Unverified
Data augmentation method for modeling health records with applications to clopidogrel treatment failure detection	Feb 28, 2024	Data Augmentation	—Unverified
Mitigating Distributional Shift in Semantic Segmentation via Uncertainty Estimation from Unlabelled Data	Feb 27, 2024	Autonomous DrivingAutonomous Vehicles	—Unverified
How we won BraTS 2023 Adult Glioma challenge? Just faking it! Enhanced Synthetic Data Augmentation and Model Ensemble for brain tumour segmentation	Feb 27, 2024	Data AugmentationDeep Learning	—Unverified
Read and Think: An Efficient Step-wise Multimodal Language Model for Document Understanding and Reasoning	Feb 26, 2024	Data Augmentationdocument understanding	—Unverified
LLM-based Privacy Data Augmentation Guided by Knowledge Distillation with a Distribution Tutor for Medical Text Classification	Feb 26, 2024	Data AugmentationKnowledge Distillation	—Unverified
A Poisson-Gamma Dynamic Factor Model with Time-Varying Transition Dynamics	Feb 26, 2024	Data AugmentationTime Series	—Unverified
Generative AI in Vision: A Survey on Models, Metrics and Applications	Feb 26, 2024	Data AugmentationDenoising	—Unverified
Towards Explainability and Fairness in Swiss Judgement Prediction: Benchmarking on a Multilingual Dataset	Feb 26, 2024	BenchmarkingCross-Lingual Transfer	—Unverified
Attention-GAN for Anomaly Detection: A Cutting-Edge Approach to Cybersecurity Threat Management	Feb 25, 2024	Anomaly DetectionData Augmentation	—Unverified
Exploring the Power of Pure Attention Mechanisms in Blind Room Parameter Estimation	Feb 25, 2024	Data Augmentationparameter estimation	—Unverified
NeSy is alive and well: A LLM-driven symbolic approach for better code comment data generation and classification	Feb 25, 2024	ClassificationData Augmentation	CodeCode Available
GenCode: A Generic Data Augmentation Framework for Boosting Deep Learning-Based Code Understanding	Feb 24, 2024	Clone DetectionData Augmentation	—Unverified
Prompt Perturbation Consistency Learning for Robust Language Models	Feb 24, 2024	Data Augmentationintent-classification	—Unverified
Leveraging ChatGPT in Pharmacovigilance Event Extraction: An Empirical Study	Feb 24, 2024	Data AugmentationEvent Extraction	CodeCode Available
Entity-level Factual Adaptiveness of Fine-tuning based Abstractive Summarization Models	Feb 23, 2024	Abstractive Text SummarizationContrastive Learning	—Unverified
ChildAugment: Data Augmentation Methods for Zero-Resource Children's Speaker Verification	Feb 23, 2024	Data AugmentationSpeaker Verification	CodeCode Available
CyberDemo: Augmenting Simulated Human Demonstration for Real-World Dexterous Manipulation	Feb 22, 2024	Data AugmentationImitation Learning	—Unverified
Two-stage Cytopathological Image Synthesis for Augmenting Cervical Abnormality Screening	Feb 22, 2024	Cell DetectionData Augmentation	—Unverified
Noise-BERT: A Unified Perturbation-Robust Framework with Noise Alignment Pre-training for Noisy Slot Filling Task	Feb 22, 2024	Adversarial AttackContrastive Learning	—Unverified
LLM-DA: Data Augmentation via Large Language Models for Few-Shot Named Entity Recognition	Feb 22, 2024	Data Augmentationfew-shot-ner	—Unverified
On Evaluation Protocols for Data Augmentation in a Limited Data Scenario	Feb 22, 2024	Data Augmentationtext-classification	—Unverified
Retrieval-Augmented Data Augmentation for Low-Resource Domain Tasks	Feb 21, 2024	Data AugmentationRetrieval	—Unverified
FormulaReasoning: A Dataset for Formula-Based Numerical Reasoning	Feb 20, 2024	Data AugmentationHigh School Physics	CodeCode Available
Code Needs Comments: Enhancing Code LLMs with Comment Augmentation	Feb 20, 2024	Data Augmentation	—Unverified
Reliable LLM-based User Simulator for Task-Oriented Dialogue Systems	Feb 20, 2024	Data AugmentationTask-Oriented Dialogue Systems	—Unverified
Plugin Speech Enhancement: A Universal Speech Enhancement Framework Inspired by Dynamic Neural Network	Feb 20, 2024	Data AugmentationSpeech Enhancement	—Unverified
Revisiting Data Augmentation in Deep Reinforcement Learning	Feb 19, 2024	Data AugmentationDeep Reinforcement Learning	CodeCode Available
HU at SemEval-2024 Task 8A: Can Contrastive Learning Learn Embeddings to Detect Machine-Generated Text?	Feb 19, 2024	Contrastive LearningData Augmentation	CodeCode Available
Regularization by denoising: Bayesian model and Langevin-within-split Gibbs sampling	Feb 19, 2024	Bayesian InferenceData Augmentation	—Unverified
ChatGPT Based Data Augmentation for Improved Parameter-Efficient Debiasing of LLMs	Feb 19, 2024	Data AugmentationFairness	CodeCode Available

Show:10 25 50

← PrevPage 66 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified