Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 8378 papers

Title	Date	Tasks	Status	Hype
Robust image representations with counterfactual contrastive learning	Sep 16, 2024	Contrastive Learningcounterfactual	CodeCode Available	1
From FDG to PSMA: A Hitchhiker's Guide to Multitracer, Multicenter Lesion Segmentation in PET/CT Imaging	Sep 14, 2024	Data AugmentationLesion Segmentation	CodeCode Available	1
Effective Pre-Training of Audio Transformers for Sound Event Detection	Sep 14, 2024	Data AugmentationEvent Detection	CodeCode Available	1
GenMapping: Unleashing the Potential of Inverse Perspective Mapping for Robust Online HD Map Construction	Sep 13, 2024	Autonomous DrivingData Augmentation	CodeCode Available	1
Data Augmentation via Latent Diffusion for Saliency Prediction	Sep 11, 2024	Data AugmentationDiversity	CodeCode Available	1
EntAugment: Entropy-Driven Adaptive Data Augmentation Framework for Image Classification	Sep 10, 2024	Data Augmentationimage-classification	CodeCode Available	1
Labeled-to-Unlabeled Distribution Alignment for Partially-Supervised Multi-Organ Medical Image Segmentation	Sep 5, 2024	Data AugmentationImage Segmentation	CodeCode Available	1
OCMG-Net: Neural Oriented Normal Refinement for Unstructured Point Clouds	Sep 2, 2024	Data Augmentation	CodeCode Available	1
Inversion Circle Interpolation: Diffusion-based Image Augmentation for Data-scarce Classification	Aug 29, 2024	ClassificationData Augmentation	CodeCode Available	1
Legilimens: Practical and Unified Content Moderation for Large Language Model Services	Aug 28, 2024	Data AugmentationLanguage Modeling	CodeCode Available	1
GenFormer -- Generated Images are All You Need to Improve Robustness of Transformers on Small Datasets	Aug 26, 2024	AllData Augmentation	CodeCode Available	1
DIAGen: Diverse Image Augmentation with Generative Models	Aug 26, 2024	Data AugmentationGeneral Knowledge	CodeCode Available	1
GenderCARE: A Comprehensive Framework for Assessing and Reducing Gender Bias in Large Language Models	Aug 22, 2024	counterfactualData Augmentation	CodeCode Available	1
SenPa-MAE: Sensor Parameter Aware Masked Autoencoder for Multi-Satellite Self-Supervised Pretraining	Aug 20, 2024	Data AugmentationDiversity	CodeCode Available	1
Wave-Mask/Mix: Exploring Wavelet-Based Augmentations for Time Series Forecasting	Aug 20, 2024	Data AugmentationTime Series	CodeCode Available	1
TDNetGen: Empowering Complex Network Resilience Prediction with Generative Augmentation of Topology and Dynamics	Aug 19, 2024	Data AugmentationPrediction	CodeCode Available	1
Generative Dataset Distillation Based on Diffusion Model	Aug 16, 2024	Data AugmentationDataset Distillation	CodeCode Available	1
Cross-View Meets Diffusion: Aerial Image Synthesis with Geometry and Text Guidance	Aug 8, 2024	BEV SegmentationData Augmentation	CodeCode Available	1
VulScribeR: Exploring RAG-based Vulnerability Augmentation with LLMs	Aug 7, 2024	Code GenerationData Augmentation	CodeCode Available	1
Training-Free Condition Video Diffusion Models for single frame Spatial-Semantic Echocardiogram Synthesis	Aug 6, 2024	Data AugmentationDomain Adaptation	CodeCode Available	1
HINER: Neural Representation for Hyperspectral Image	Jul 31, 2024	ClassificationData Augmentation	CodeCode Available	1
Leveraging Foundation Models for Zero-Shot IoT Sensing	Jul 29, 2024	Data AugmentationGeneralized Zero-Shot Learning	CodeCode Available	1
SMPISD-MTPNet: Scene Semantic Prior-Assisted Infrared Ship Detection Using Multi-Task Perception Networks	Jul 26, 2024	Data AugmentationScene Segmentation	CodeCode Available	1
Self-Supervision Improves Diffusion Models for Tabular Data Imputation	Jul 25, 2024	Data AugmentationDiversity	CodeCode Available	1
LLaST: Improved End-to-end Speech Translation System Leveraged by Large Language Models	Jul 22, 2024	Data AugmentationLanguage Modeling	CodeCode Available	1
Shap-Mix: Shapley Value Guided Mixing for Long-Tailed Skeleton Based Action Recognition	Jul 17, 2024	Action RecognitionData Augmentation	CodeCode Available	1
Multi-Modal and Multi-Attribute Generation of Single Cells with CFGen	Jul 16, 2024	AttributeData Augmentation	CodeCode Available	1
SegSTRONG-C: Segmenting Surgical Tools Robustly On Non-adversarial Generated Corruptions -- An EndoVis'24 Challenge	Jul 16, 2024	Adversarial RobustnessData Augmentation	CodeCode Available	1
Augmented Neural Fine-Tuning for Efficient Backdoor Purification	Jul 14, 2024	Action RecognitionData Augmentation	CodeCode Available	1
CAR-MFL: Cross-Modal Augmentation by Retrieval for Multimodal Federated Learning with Missing Modalities	Jul 11, 2024	Data AugmentationFederated Learning	CodeCode Available	1
SUMix: Mixup with Semantic and Uncertain Information	Jul 10, 2024	Data Augmentation	CodeCode Available	1
Deformation-Recovery Diffusion Model (DRDM): Instance Deformation for Image Manipulation and Synthesis	Jul 10, 2024	Data AugmentationFew-Shot Learning	CodeCode Available	1
InverseCoder: Self-improving Instruction-Tuned Code LLMs with Inverse-Instruct	Jul 8, 2024	Code GenerationCode Summarization	CodeCode Available	1
On the power of data augmentation for head pose estimation	Jul 7, 2024	Data AugmentationFace Alignment	CodeCode Available	1
Fine-Grained and Interpretable Neural Speech Editing	Jul 7, 2024	Data AugmentationSpeech Synthesis	CodeCode Available	1
Diffusion as Sound Propagation: Physics-inspired Model for Ultrasound Image Generation	Jul 7, 2024	Data AugmentationImage Generation	CodeCode Available	1
Leveraging Latent Diffusion Models for Training-Free In-Distribution Data Augmentation for Surface Defect Detection	Jul 4, 2024	Data AugmentationDefect Detection	CodeCode Available	1
LLMAEL: Large Language Models are Good Context Augmenters for Entity Linking	Jul 4, 2024	Data AugmentationEntity Linking	CodeCode Available	1
HRSAM: Efficient Interactive Segmentation in High-Resolution Images	Jul 2, 2024	Data AugmentationGPU	CodeCode Available	1
MedMNIST-C: Comprehensive benchmark and improved classifier robustness by simulating realistic image corruptions	Jun 25, 2024	Data AugmentationDomain Generalization	CodeCode Available	1
AutoDetect: Towards a Unified Framework for Automated Weakness Detection in Large Language Models	Jun 24, 2024	BenchmarkingData Augmentation	CodeCode Available	1
RuleR: Improving LLM Controllability by Rule-based Data Recycling	Jun 22, 2024	Data AugmentationInstruction Following	CodeCode Available	1
Self Training and Ensembling Frequency Dependent Networks with Coarse Prediction Pooling and Sound Event Bounding Boxes	Jun 22, 2024	Change DetectionData Augmentation	CodeCode Available	1
Voice Disorder Analysis: a Transformer-based Approach	Jun 20, 2024	Data AugmentationDiversity	CodeCode Available	1
Advancing Fine-Grained Classification by Structure and Subject Preserving Augmentation	Jun 20, 2024	Data AugmentationDiversity	CodeCode Available	1
Zero-Shot Image Denoising for High-Resolution Electron Microscopy	Jun 20, 2024	Data AugmentationDenoising	CodeCode Available	1
QDA-SQL: Questions Enhanced Dialogue Augmentation for Multi-Turn Text-to-SQL	Jun 15, 2024	Data AugmentationText to SQL	CodeCode Available	1
DemosaicFormer: Coarse-to-Fine Demosaicing Network for HybridEVS Camera	Jun 12, 2024	Data AugmentationDemosaicking	CodeCode Available	1
Dataset Enhancement with Instance-Level Augmentations	Jun 12, 2024	Data AugmentationObject	CodeCode Available	1
MM-KWS: Multi-modal Prompts for Multilingual User-defined Keyword Spotting	Jun 11, 2024	Data AugmentationKeyword Spotting	CodeCode Available	1

Show:10 25 50

← PrevPage 6 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified