Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 801–850 of 8378 papers

Title	Date	Tasks	Status	Hype
A Novel Data Augmentation Tool for Enhancing Machine Learning Classification: A New Application of the Higher Order Dynamic Mode Decomposition for Improved Cardiac Disease Identification	Nov 24, 2024	Data Augmentation	—Unverified	0
AeroGen: Enhancing Remote Sensing Object Detection with Diffusion-Driven Data Generation	Nov 23, 2024	Data AugmentationDiversity	CodeCode Available	2
Machine-agnostic Automated Lumbar MRI Segmentation using a Cascaded Model Based on Generative Neurons	Nov 23, 2024	Data AugmentationDecoder	—Unverified	0
Open-Amp: Synthetic Data Framework for Audio Effect Foundation Models	Nov 22, 2024	Data AugmentationInformation Retrieval	CodeCode Available	1
Towards Speaker Identification with Minimal Dataset and Constrained Resources using 1D-Convolution Neural Network	Nov 22, 2024	Data AugmentationSpeaker Identification	CodeCode Available	0
Reconciling Semantic Controllability and Diversity for Remote Sensing Image Synthesis with Hybrid Semantic Embedding	Nov 22, 2024	Data AugmentationDiversity	—Unverified	0
Simplifying CLIP: Unleashing the Power of Large-Scale Models on Consumer-level Computers	Nov 22, 2024	Data AugmentationGPU	—Unverified	0
Evaluating LLM Prompts for Data Augmentation in Multi-label Classification of Ecological Texts	Nov 22, 2024	Data AugmentationMulti-Label Classification	—Unverified	0
An Experimental Study on Data Augmentation Techniques for Named Entity Recognition on Low-Resource Domains	Nov 21, 2024	Data Augmentationnamed-entity-recognition	—Unverified	0
MVANet: Multi-Stage Video Attention Network for Sound Event Localization and Detection with Source Distance Estimation	Nov 21, 2024	Data AugmentationSound Event Localization and Detection	CodeCode Available	0
Next-Generation Phishing: How LLM Agents Empower Cyber Attackers	Nov 21, 2024	Data Augmentation	—Unverified	0
Improving Routability Prediction via NAS Using a Smooth One-shot Augmented Predictor	Nov 21, 2024	Data AugmentationNeural Architecture Search	—Unverified	0
Conditional Distribution Learning on Graphs	Nov 20, 2024	Contrastive LearningData Augmentation	CodeCode Available	0
On the Way to LLM Personalization: Learning to Remember User Conversations	Nov 20, 2024	Data AugmentationRAG	—Unverified	0
Hard-Synth: Synthesizing Diverse Hard Samples for ASR using Zero-Shot TTS and LLM	Nov 20, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Simulating Liquidity: Agent-Based Modeling of Illiquid Markets for Fractional Ownership	Nov 20, 2024	Data Augmentation	—Unverified	0
SynEHRgy: Synthesizing Mixed-Type Structured Electronic Health Records using Decoder-Only Transformers	Nov 20, 2024	Data AugmentationDecoder	—Unverified	0
Residual Vision Transformer (ResViT) Based Self-Supervised Learning Model for Brain Tumor Classification	Nov 19, 2024	Brain Tumor ClassificationData Augmentation	—Unverified	0
Balancing Accuracy and Efficiency in Multi-Turn Intent Classification for LLM-Powered Dialog Systems in Production	Nov 19, 2024	ClassificationData Augmentation	—Unverified	0
Whisper Finetuning on Nepali Language	Nov 19, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Can Open-source LLMs Enhance Data Synthesis for Toxic Detection?: An Experimental Study	Nov 18, 2024	Data AugmentationHallucination	—Unverified	0
FLAME: Frozen Large Language Models Enable Data-Efficient Language-Image Pre-training	Nov 18, 2024	Data AugmentationImage to text	CodeCode Available	1
Online Item Cold-Start Recommendation with Popularity-Aware Meta-Learning	Nov 18, 2024	Data AugmentationMeta-Learning	CodeCode Available	0
Generalizable Person Re-identification via Balancing Alignment and Uniformity	Nov 18, 2024	Data AugmentationGeneralizable Person Re-identification	CodeCode Available	1
Variational Bayesian Bow tie Neural Networks with Shrinkage	Nov 17, 2024	Bayesian InferenceData Augmentation	CodeCode Available	0
Wafer Map Defect Classification Using Autoencoder-Based Data Augmentation and Convolutional Neural Network	Nov 17, 2024	ClassificationData Augmentation	—Unverified	0
Improvement in Facial Emotion Recognition using Synthetic Data Generated by Diffusion Model	Nov 16, 2024	Data AugmentationEmotion Recognition	CodeCode Available	0
LTCXNet: Advancing Chest X-Ray Analysis with Solutions for Long-Tailed Multi-Label Classification and Fairness Challenges	Nov 16, 2024	Data AugmentationDecoder	—Unverified	0
Enhancing PTSD Outcome Prediction with Ensemble Models in Disaster Contexts	Nov 16, 2024	Data Augmentation	—Unverified	0
Counterfactual Learning-Driven Representation Disentanglement for Search-Enhanced Recommendation	Nov 14, 2024	Collaborative Filteringcounterfactual	—Unverified	0
Bayesian estimation of finite mixtures of Tobit models	Nov 14, 2024	Data Augmentation	—Unverified	0
Are nuclear masks all you need for improved out-of-domain generalisation? A closer look at cancer classification in histopathology	Nov 14, 2024	AllCancer Classification	CodeCode Available	0
A Heterogeneous Graph Neural Network Fusing Functional and Structural Connectivity for MCI Diagnosis	Nov 13, 2024	Data AugmentationGraph Neural Network	—Unverified	0
Optimal Transport-Based Displacement Interpolation with Data Augmentation for Reduced Order Modeling of Nonlinear Dynamical Systems	Nov 13, 2024	Data Augmentation	—Unverified	0
Graph Neural Network Generalization with Gaussian Mixture Model Based Augmentation	Nov 13, 2024	Data AugmentationDiversity	—Unverified	0
Generative AI for Data Augmentation in Wireless Networks: Analysis, Applications, and Case Study	Nov 13, 2024	Data AugmentationGesture Recognition	CodeCode Available	0
Emotion Classification of Children Expressions	Nov 12, 2024	ClassificationData Augmentation	—Unverified	0
Artificial Intelligence for Biomedical Video Generation	Nov 12, 2024	Data AugmentationVideo Generation	CodeCode Available	0
Isometric Transformations for Image Augmentation in Mueller Matrix Polarimetry	Nov 12, 2024	Data AugmentationImage Augmentation	CodeCode Available	0
DeepCRF: Deep Learning-Enhanced CSI-Based RF Fingerprinting for Channel-Resilient WiFi Device Identification	Nov 11, 2024	Contrastive LearningData Augmentation	CodeCode Available	1
Exploring Variational Autoencoders for Medical Image Generation: A Comprehensive Study	Nov 11, 2024	Data AugmentationDiversity	—Unverified	0
SE(3) Equivariant Ray Embeddings for Implicit Multi-View Depth Estimation	Nov 11, 2024	Data AugmentationDecoder	—Unverified	0
Clustering Algorithms and RAG Enhancing Semi-Supervised Text Classification with Large LLMs	Nov 9, 2024	ClassificationClustering	—Unverified	0
Reducing Distraction in Long-Context Language Models by Focused Learning	Nov 8, 2024	Contrastive LearningData Augmentation	—Unverified	0
A Quality-Centric Framework for Generic Deepfake Detection	Nov 8, 2024	Data AugmentationDeepFake Detection	—Unverified	0
Tibyan Corpus: Balanced and Comprehensive Error Coverage Corpus Using ChatGPT for Arabic Grammatical Error Correction	Nov 7, 2024	Data AugmentationGrammatical Error Correction	—Unverified	0
Progressive Multi-Level Alignments for Semi-Supervised Domain Adaptation SAR Target Recognition Using Simulated Data	Nov 7, 2024	Data AugmentationDomain Adaptation	—Unverified	0
Diff-2-in-1: Bridging Generation and Dense Perception with Diffusion Models	Nov 7, 2024	Data AugmentationDenoising	—Unverified	0
GASE: Generatively Augmented Sentence Encoding	Nov 7, 2024	Data AugmentationSemantic Textual Similarity	—Unverified	0
Impact of Label Noise on Learning Complex Features	Nov 7, 2024	Data AugmentationInductive Bias	—Unverified	0

Show:10 25 50

← PrevPage 17 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified