Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 8378 papers

Title	Date	Tasks	Status	Hype
MVCNet: Multi-View Contrastive Network for Motor Imagery Classification	Feb 18, 2025	Brain Computer InterfaceContrastive Learning	CodeCode Available	1
Understanding In-Context Machine Translation for Low-Resource Languages: A Case Study on Manchu	Feb 17, 2025	Data AugmentationIn-Context Learning	CodeCode Available	1
ReLearn: Unlearning via Learning for Large Language Models	Feb 16, 2025	Data AugmentationText Generation	CodeCode Available	1
MGPATH: Vision-Language Model with Multi-Granular Prompt Learning for Few-Shot WSI Classification	Feb 11, 2025	Contrastive LearningData Augmentation	CodeCode Available	1
Multi-Class Segmentation of Aortic Branches and Zones in Computed Tomography Angiography: The AortaSeg24 Challenge	Feb 7, 2025	Data AugmentationSegmentation	CodeCode Available	1
SpaceGNN: Multi-Space Graph Neural Network for Node Anomaly Detection with Extremely Limited Labels	Feb 5, 2025	Anomaly DetectionData Augmentation	CodeCode Available	1
A Cartesian Encoding Graph Neural Network for Crystal Structures Property Prediction: Application to Thermal Ellipsoid Estimation	Jan 30, 2025	ADP PredictionBand Gap	CodeCode Available	1
Image, Text, and Speech Data Augmentation using Multimodal LLMs for Deep Learning: A Survey	Jan 29, 2025	Data AugmentationImage Augmentation	CodeCode Available	1
CLISC: Bridging clip and sam by enhanced cam for unsupervised brain tumor segmentation	Jan 27, 2025	Brain Tumor SegmentationData Augmentation	CodeCode Available	1
MixRec: Individual and Collective Mixing Empowers Data Augmentation for Recommender Systems	Jan 23, 2025	Contrastive LearningData Augmentation	CodeCode Available	1
A Survey of World Models for Autonomous Driving	Jan 20, 2025	Anomaly DetectionAutonomous Driving	CodeCode Available	1
A Simple Graph Contrastive Learning Framework for Short Text Classification	Jan 16, 2025	Contrastive LearningData Augmentation	CodeCode Available	1
DiffuSETS: 12-lead ECG Generation Conditioned on Clinical Text Reports and Patient-Specific Information	Jan 10, 2025	BenchmarkingData Augmentation	CodeCode Available	1
Context-Aware Deep Learning for Multi Modal Depression Detection	Dec 26, 2024	Data AugmentationDeep Learning	CodeCode Available	1
DefFiller: Mask-Conditioned Diffusion for Salient Steel Surface Defect Generation	Dec 20, 2024	Data AugmentationDefect Detection	CodeCode Available	1
ResoFilter: Fine-grained Synthetic Data Filtering for Large Language Models through Data-Parameter Resonance Analysis	Dec 19, 2024	Data AugmentationSynthetic Data Generation	CodeCode Available	1
DS^2-ABSA: Dual-Stream Data Synthesis with Label Refinement for Few-Shot Aspect-Based Sentiment Analysis	Dec 19, 2024	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available	1
MixRec: Heterogeneous Graph Collaborative Filtering	Dec 18, 2024	Collaborative FilteringContrastive Learning	CodeCode Available	1
PhysAug: A Physical-guided and Frequency-based Data Augmentation for Single-Domain Generalized Object Detection	Dec 16, 2024	Data AugmentationDomain Generalization	CodeCode Available	1
AD-LLM: Benchmarking Large Language Models for Anomaly Detection	Dec 15, 2024	Anomaly DetectionBenchmarking	CodeCode Available	1
Learning Normal Flow Directly From Event Neighborhoods	Dec 15, 2024	Data AugmentationOptical Flow Estimation	CodeCode Available	1
ST-FiT: Inductive Spatial-Temporal Forecasting with Limited Training Data	Dec 14, 2024	Data Augmentation	CodeCode Available	1
FM2S: Towards Spatially-Correlated Noise Modeling in Zero-Shot Fluorescence Microscopy Image Denoising	Dec 13, 2024	Computational EfficiencyData Augmentation	CodeCode Available	1
Augmenting Sequential Recommendation with Balanced Relevance and Diversity	Dec 11, 2024	Data AugmentationDiversity	CodeCode Available	1
T2Vid: Translating Long Text into Multi-Image is the Catalyst for Video-LLMs	Nov 29, 2024	Data AugmentationDiversity	CodeCode Available	1
MaskRIS: Semantic Distortion-aware Data Augmentation for Referring Image Segmentation	Nov 28, 2024	Data AugmentationImage Segmentation	CodeCode Available	1
Training and Evaluating Language Models with Template-based Data Generation	Nov 27, 2024	Data AugmentationMath	CodeCode Available	1
Open-Amp: Synthetic Data Framework for Audio Effect Foundation Models	Nov 22, 2024	Data AugmentationInformation Retrieval	CodeCode Available	1
FLAME: Frozen Large Language Models Enable Data-Efficient Language-Image Pre-training	Nov 18, 2024	Data AugmentationImage to text	CodeCode Available	1
Generalizable Person Re-identification via Balancing Alignment and Uniformity	Nov 18, 2024	Data AugmentationGeneralizable Person Re-identification	CodeCode Available	1
DeepCRF: Deep Learning-Enhanced CSI-Based RF Fingerprinting for Channel-Resilient WiFi Device Identification	Nov 11, 2024	Contrastive LearningData Augmentation	CodeCode Available	1
Stem-OB: Generalizable Visual Imitation Learning with Stem-Like Convergent Observation through Diffusion Inversion	Nov 7, 2024	Data AugmentationImitation Learning	CodeCode Available	1
DiffBatt: A Diffusion Model for Battery Degradation Prediction and Synthesis	Oct 31, 2024	Battery cycle life predictionData Augmentation	CodeCode Available	1
DAVINCI: A Single-Stage Architecture for Constrained CAD Sketch Inference	Oct 30, 2024	Data Augmentation	CodeCode Available	1
Mitigating Unauthorized Speech Synthesis for Voice Protection	Oct 28, 2024	Data AugmentationFace Swapping	CodeCode Available	1
Shape Transformation Driven by Active Contour for Class-Imbalanced Semi-Supervised Medical Image Segmentation	Oct 18, 2024	Data AugmentationImage Segmentation	CodeCode Available	1
Diffusion Curriculum: Synthetic-to-Real Generative Curriculum Learning via Image-Guided Diffusion	Oct 17, 2024	Data AugmentationImage Generation	CodeCode Available	1
Minority-Focused Text-to-Image Generation via Prompt Optimization	Oct 10, 2024	Data AugmentationImage Generation	CodeCode Available	1
RFBoost: Understanding and Boosting Deep WiFi Sensing via Physical Data Augmentation	Oct 4, 2024	Data Augmentation	CodeCode Available	1
Capturing complex hand movements and object interactions using machine learning-powered stretchable smart textile gloves	Oct 3, 2024	Data Augmentation	CodeCode Available	1
HarmAug: Effective Data Augmentation for Knowledge Distillation of Safety Guard Models	Oct 2, 2024	Data AugmentationKnowledge Distillation	CodeCode Available	1
Synthio: Augmenting Small-Scale Audio Classification Datasets with Synthetic Data	Oct 2, 2024	Audio ClassificationCaption Generation	CodeCode Available	1
Data Extrapolation for Text-to-image Generation on Small Datasets	Oct 2, 2024	Data AugmentationImage Generation	CodeCode Available	1
Exploring Empty Spaces: Human-in-the-Loop Data Augmentation	Oct 1, 2024	Data AugmentationDiversity	CodeCode Available	1
RAD: A Dataset and Benchmark for Real-Life Anomaly Detection with Robotic Observations	Oct 1, 2024	Anomaly DetectionData Augmentation	CodeCode Available	1
SWIM: Short-Window CNN Integrated with Mamba for EEG-Based Auditory Spatial Attention Decoding	Sep 30, 2024	Data AugmentationEEG	CodeCode Available	1
DALDA: Data Augmentation Leveraging Diffusion Model and LLM with Adaptive Guidance Scaling	Sep 25, 2024	Data AugmentationDiversity	CodeCode Available	1
TabEBM: A Tabular Data Augmentation Method with Distinct Class-Specific Energy-Based Models	Sep 24, 2024	ClassificationData Augmentation	CodeCode Available	1
Deep-Wide Learning Assistance for Insect Pest Classification	Sep 16, 2024	ClassificationData Augmentation	CodeCode Available	1
Robust image representations with counterfactual contrastive learning	Sep 16, 2024	Contrastive Learningcounterfactual	CodeCode Available	1

Show:10 25 50

← PrevPage 5 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified