Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2501–2550 of 8378 papers

Title	Date	Tasks	Status
SymDiff: Equivariant Diffusion via Stochastic Symmetrisation	Oct 8, 2024	Data Augmentation	—Unverified
HumVI: A Multilingual Dataset for Detecting Violent Incidents Impacting Humanitarian Aid	Oct 8, 2024	ArticlesData Augmentation	CodeCode Available
Collapsed Language Models Promote Fairness	Oct 6, 2024	Data AugmentationFairness	CodeCode Available
Correlation-Aware Select and Merge Attention for Efficient Fine-Tuning and Context Length Extension	Oct 5, 2024	16kData Augmentation	—Unverified
CUDLE: Learning Under Label Scarcity to Detect Cannabis Use in Uncontrolled Environments	Oct 4, 2024	Contrastive LearningData Augmentation	—Unverified
Comparative Analysis and Ensemble Enhancement of Leading CNN Architectures for Breast Cancer Classification	Oct 4, 2024	Cancer ClassificationClassification	—Unverified
Investigating and Mitigating Object Hallucinations in Pretrained Vision-Language (CLIP) Models	Oct 4, 2024	counterfactualData Augmentation	CodeCode Available
SAFLEX: Self-Adaptive Augmentation via Feature Label Extrapolation	Oct 3, 2024	Bilevel OptimizationData Augmentation	—Unverified
AlzhiNet: Traversing from 2DCNN to 3DCNN, Towards Early Detection and Diagnosis of Alzheimer's Disease	Oct 3, 2024	Data Augmentation	—Unverified
QDGset: A Large Scale Grasping Dataset Generated with Quality-Diversity	Oct 3, 2024	Data AugmentationDiversity	—Unverified
Cognitive Biases in Large Language Models for News Recommendation	Oct 3, 2024	Data AugmentationMisinformation	—Unverified
Can Language Models Take A Hint? Prompting for Controllable Contextualized Commonsense Inference	Oct 3, 2024	Data AugmentationText Generation	—Unverified
A Novel Method for Accurate & Real-time Food Classification: The Synergistic Integration of EfficientNetB7, CBAM, Transfer Learning, and Data Augmentation	Oct 3, 2024	Data AugmentationTransfer Learning	—Unverified
ProxiMix: Enhancing Fairness with Proximity Samples in Subgroups	Oct 2, 2024	Data AugmentationFairness	—Unverified
Intent Detection in the Age of LLMs	Oct 2, 2024	Data AugmentationIn-Context Learning	—Unverified
Ensembles provably learn equivariance through data augmentation	Oct 2, 2024	Data Augmentation	CodeCode Available
TAEGAN: Generating Synthetic Tabular Data For Data Augmentation	Oct 2, 2024	Data AugmentationGenerative Adversarial Network	—Unverified
Generate then Refine: Data Augmentation for Zero-shot Intent Detection	Oct 2, 2024	Data AugmentationDiversity	CodeCode Available
Equivariant score-based generative models provably learn distributions with symmetries efficiently	Oct 2, 2024	Data AugmentationGeneralization Bounds	—Unverified
PersonaMath: Enhancing Math Reasoning through Persona-Driven Data Augmentation	Oct 2, 2024	Data AugmentationDiversity	—Unverified
Formula-Driven Data Augmentation and Partial Retinal Layer Copying for Retinal Layer Segmentation	Oct 2, 2024	Data AugmentationSegmentation	—Unverified
Augmentation through Laundering Attacks for Audio Spoof Detection	Oct 1, 2024	Data AugmentationFace Swapping	—Unverified
Cross-lingual Back-Parsing: Utterance Synthesis from Meaning Representation for Zero-Resource Semantic Parsing	Oct 1, 2024	Cross-Lingual TransferData Augmentation	CodeCode Available
Targeted synthetic data generation for tabular data via hardness characterization	Oct 1, 2024	Data AugmentationData Valuation	CodeCode Available
SyntheOcc: Synthesize Geometric-Controlled Street View Images through 3D Semantic MPIs	Oct 1, 2024	Autonomous DrivingData Augmentation	—Unverified
From Natural Language to SQL: Review of LLM-based Text-to-SQL Systems	Oct 1, 2024	Computational EfficiencyData Augmentation	—Unverified
Pseudo-Non-Linear Data Augmentation via Energy Minimization	Oct 1, 2024	Data AugmentationDimensionality Reduction	—Unverified
Enhancing Romanian Offensive Language Detection through Knowledge Distillation, Multi-Task Learning, and Data Augmentation	Sep 30, 2024	Data AugmentationKnowledge Distillation	—Unverified
Accent conversion using discrete units with parallel data synthesized from controllable accented TTS	Sep 30, 2024	Data AugmentationSpeech Synthesis	—Unverified
Erase, then Redraw: A Novel Data Augmentation Approach for Free Space Detection Using Diffusion Model	Sep 30, 2024	Data AugmentationDiversity	—Unverified
Depression detection in social media posts using transformer-based models and auxiliary features	Sep 30, 2024	Data AugmentationDepression Detection	—Unverified
FlexSBDD: Structure-Based Drug Design with Flexible Protein Modeling	Sep 29, 2024	Data AugmentationDrug Design	—Unverified
DropEdge not Foolproof: Effective Augmentation Method for Signed Graph Neural Networks	Sep 29, 2024	Data AugmentationLink Sign Prediction	—Unverified
Membership Privacy Evaluation in Deep Spiking Neural Networks	Sep 28, 2024	Data AugmentationFace Recognition	—Unverified
Introducing SDICE: An Index for Assessing Diversity of Synthetic Medical Datasets	Sep 28, 2024	Data AugmentationDiversity	—Unverified
TwinCL: A Twin Graph Contrastive Learning Model for Collaborative Filtering	Sep 27, 2024	Collaborative FilteringContrastive Learning	CodeCode Available
HardCore Generation: Generating Hard UNSAT Problems for Data Augmentation	Sep 27, 2024	Data AugmentationGraph Neural Network	—Unverified
Multi-modal Cross-domain Self-supervised Pre-training for fMRI and EEG Fusion	Sep 27, 2024	Data AugmentationEEG	—Unverified
Reducing and Exploiting Data Augmentation Noise through Meta Reweighting Contrastive Learning for Text Classification	Sep 26, 2024	Contrastive LearningData Augmentation	—Unverified
Conjugate Bayesian Two-step Change Point Detection for Hawkes Process	Sep 26, 2024	Change Point DetectionComputational Efficiency	CodeCode Available
Good Data Is All Imitation Learning Needs	Sep 26, 2024	Allcounterfactual	—Unverified
Enhancing elusive clues in knowledge learning by contrasting attention of language models	Sep 26, 2024	Data AugmentationLanguage Modeling	CodeCode Available
Advancing Open-Set Domain Generalization Using Evidential Bi-Level Hardest Domain Scheduler	Sep 26, 2024	Data AugmentationDomain Generalization	CodeCode Available
Visual Data Diagnosis and Debiasing with Concept Graphs	Sep 26, 2024	Data AugmentationKnowledge Graphs	CodeCode Available
Jump Diffusion-Informed Neural Networks with Transfer Learning for Accurate American Option Pricing under Data Scarcity	Sep 26, 2024	Bayesian OptimizationData Augmentation	—Unverified
Grading and Anomaly Detection for Automated Retinal Image Analysis using Deep Learning	Sep 25, 2024	Anomaly DetectionArticles	—Unverified
Non-stationary BERT: Exploring Augmented IMU Data For Robust Human Activity Recognition	Sep 25, 2024	Activity RecognitionData Augmentation	—Unverified
Small data deep learning methodology for in-field disease detection	Sep 25, 2024	Data AugmentationDeep Learning	—Unverified
WasteGAN: Data Augmentation for Robotic Waste Sorting through Generative Adversarial Networks	Sep 25, 2024	Data AugmentationSemantic Segmentation	CodeCode Available
Weighted Cross-entropy for Low-Resource Languages in Multilingual Speech Recognition	Sep 25, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available

Show:10 25 50

← PrevPage 51 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified