Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2251–2300 of 8378 papers

Title	Date	Tasks	Status
Fast Mixing of Data Augmentation Algorithms: Bayesian Probit, Logit, and Lasso Regression	Dec 11, 2024	Data Augmentationregression	CodeCode Available
AGMixup: Adaptive Graph Mixup for Semi-supervised Node Classification	Dec 11, 2024	Data AugmentationNode Classification	CodeCode Available
Comparative Opinion Mining in Product Reviews: Multi-perspective Prompt-based Learning	Dec 11, 2024	Data AugmentationOpinion Mining	—Unverified
LLaVA-Zip: Adaptive Visual Token Compression with Intrinsic Image Information	Dec 11, 2024	Data AugmentationInstruction Following	—Unverified
Can We Generate Visual Programs Without Prompting LLMs?	Dec 11, 2024	Data AugmentationQuestion Answering	—Unverified
A Physics-based Generative Model to Synthesize Training Datasets for MRI-based Fat Quantification	Dec 11, 2024	Data AugmentationQuantitative MRI	—Unverified
BDA: Bangla Text Data Augmentation Framework	Dec 11, 2024	Data Augmentationtext-classification	CodeCode Available
Improving the Natural Language Inference robustness to hard dataset by data augmentation and preprocessing	Dec 10, 2024	Data AugmentationNatural Language Inference	—Unverified
CoPrUS: Consistency Preserving Utterance Synthesis towards more realistic benchmark dialogues	Dec 10, 2024	Data AugmentationLanguage Modeling	CodeCode Available
Optimizing Alignment with Less: Leveraging Data Augmentation for Personalized Evaluation	Dec 10, 2024	Data AugmentationMathematical Reasoning	—Unverified
A Parametric Approach to Adversarial Augmentation for Cross-Domain Iris Presentation Attack Detection	Dec 10, 2024	Cross-Domain Iris Presentation Attack DetectionData Augmentation	CodeCode Available
Leveraging Content and Context Cues for Low-Light Image Enhancement	Dec 10, 2024	Data AugmentationFace Detection	CodeCode Available
Bayesian Data Augmentation and Training for Perception DNN in Autonomous Aerial Vehicles	Dec 10, 2024	Autonomous VehiclesBayesian Optimization	CodeCode Available
Multi-Scale Contrastive Learning for Video Temporal Grounding	Dec 10, 2024	Contrastive LearningData Augmentation	—Unverified
Generative Modeling and Data Augmentation for Power System Production Simulation	Dec 10, 2024	Data AugmentationLoad Forecasting	CodeCode Available
World-Consistent Data Generation for Vision-and-Language Navigation	Dec 9, 2024	Data AugmentationNavigate	—Unverified
SGIA: Enhancing Fine-Grained Visual Classification with Sequence Generative Image Augmentation	Dec 9, 2024	Data AugmentationFew-Shot Learning	—Unverified
Data Augmentation with Variational Autoencoder for Imbalanced Dataset	Dec 9, 2024	Data Augmentationregression	CodeCode Available
HSDA: High-frequency Shuffle Data Augmentation for Bird's-Eye-View Map Segmentation	Dec 9, 2024	Autonomous DrivingData Augmentation	CodeCode Available
MIMO Detection under Hardware Impairments: Data Augmentation With Boosting	Dec 8, 2024	Data AugmentationDensity Estimation	—Unverified
Comprehensive Evaluation of Multimodal AI Models in Medical Imaging Diagnosis: From Data Augmentation to Preference-Based Comparison	Dec 7, 2024	Data Augmentation	—Unverified
UNet++ and LSTM combined approach for Breast Ultrasound Image Segmentation	Dec 7, 2024	Data AugmentationImage Segmentation	—Unverified
SQ-Whisper: Speaker-Querying based Whisper Model for Target-Speaker ASR	Dec 7, 2024	Automatic Speech RecognitionData Augmentation	CodeCode Available
Generative Model-Based Fusion for Improved Few-Shot Semantic Segmentation of Infrared Images	Dec 6, 2024	Autonomous DrivingData Augmentation	—Unverified
Improving Post-Earthquake Crack Detection using Semi-Synthetic Generated Images	Dec 6, 2024	Data Augmentation	—Unverified
EvTTC: An Event Camera Dataset for Time-to-Collision Estimation	Dec 6, 2024	Data Augmentation	—Unverified
Building a Family of Data Augmentation Models for Low-cost LLM Fine-tuning on the Cloud	Dec 6, 2024	Data Augmentation	—Unverified
BhashaVerse : Translation Ecosystem for Indian Subcontinent Languages	Dec 5, 2024	Automatic Post-EditingData Augmentation	—Unverified
Enhancing Mathematical Reasoning in LLMs with Background Operators	Dec 5, 2024	Data AugmentationMath	—Unverified
Curriculum-style Data Augmentation for LLM-based Metaphor Detection	Dec 4, 2024	Data Augmentation	—Unverified
Channel Reflection: Knowledge-Driven Data Augmentation for EEG-Based Brain-Computer Interfaces	Dec 4, 2024	Brain Computer InterfaceData Augmentation	—Unverified
Few-Shot Learning with Adaptive Weight Masking in Conditional GANs	Dec 4, 2024	Data AugmentationDiversity	—Unverified
Variable-Speed Teaching-Playback as Real-World Data Augmentation for Imitation Learning	Dec 4, 2024	Data AugmentationImitation Learning	—Unverified
Tight PAC-Bayesian Risk Certificates for Contrastive Learning	Dec 4, 2024	Contrastive LearningData Augmentation	CodeCode Available
Distillation of Diffusion Features for Semantic Correspondence	Dec 4, 2024	3D ReconstructionData Augmentation	—Unverified
QA-TOOLBOX: Conversational Question-Answering for process task guidance in manufacturing	Dec 3, 2024	Conversational Question AnsweringData Augmentation	—Unverified
Planning-Guided Diffusion Policy Learning for Generalizable Contact-Rich Bimanual Manipulation	Dec 3, 2024	Data Augmentation	—Unverified
GUESS: Generative Uncertainty Ensemble for Self Supervision	Dec 3, 2024	Data AugmentationSelf-Supervised Learning	—Unverified
Robust soybean seed yield estimation using high-throughput ground robot videos	Dec 3, 2024	Data Augmentation	—Unverified
GenMix: Effective Data Augmentation with Generative Diffusion Model Image Editing	Dec 3, 2024	Adversarial RobustnessData Augmentation	—Unverified
Direct Coloring for Self-Supervised Enhanced Feature Decoupling	Dec 3, 2024	Data AugmentationRepresentation Learning	—Unverified
Evaluating the Impact of Data Augmentation on Predictive Model Performance	Dec 3, 2024	Data Augmentation	—Unverified
Su-RoBERTa: A Semi-supervised Approach to Predicting Suicide Risk through Social Media using Base Language Models	Dec 2, 2024	Data Augmentation	—Unverified
ECG-SleepNet: Deep Learning-Based Comprehensive Sleep Stage Classification Using ECG Signals	Dec 2, 2024	ClassificationData Augmentation	—Unverified
Multi-View Incongruity Learning for Multimodal Sarcasm Detection	Dec 1, 2024	Contrastive LearningData Augmentation	—Unverified
A Semi-Supervised Approach with Error Reflection for Echocardiography Segmentation	Dec 1, 2024	Data AugmentationImage Segmentation	—Unverified
Improving speaker verification robustness with synthetic emotional utterances	Nov 30, 2024	Data AugmentationSpeaker Verification	—Unverified
Table Integration in Data Lakes Unleashed: Pairwise Integrability Judgment, Integrable Set Discovery, and Multi-Tuple Conflict Resolution	Nov 30, 2024	Community DetectionContrastive Learning	—Unverified
BGM: Background Mixup for X-ray Prohibited Items Detection	Nov 30, 2024	Data AugmentationImage Augmentation	—Unverified
Topology-Preserving Scaling in Data Augmentation	Nov 29, 2024	Data Augmentation	—Unverified

Show:10 25 50

← PrevPage 46 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified