Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2601–2650 of 8378 papers

Title	Date	Tasks	Status
Exploring the Impact of Data Quantity on ASR in Extremely Low-resource Languages	Sep 13, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Test-time Training for Hyperspectral Image Super-resolution	Sep 13, 2024	Data AugmentationHyperspectral Image Super-Resolution	—Unverified
FPMT: Enhanced Semi-Supervised Model for Traffic Incident Detection	Sep 12, 2024	Data Augmentation	—Unverified
AutoPET Challenge: Tumour Synthesis for Data Augmentation	Sep 12, 2024	Data AugmentationLesion Segmentation	—Unverified
Improving Anomalous Sound Detection via Low-Rank Adaptation Fine-Tuning of Pre-Trained Audio Models	Sep 11, 2024	Data AugmentationTask 2	—Unverified
Controllable retinal image synthesis using conditional StyleGAN and latent space manipulation for improved diagnosis and grading of diabetic retinopathy	Sep 11, 2024	Data AugmentationImage Generation	—Unverified
Multi-scale decomposition of sea surface height snapshots using machine learning	Sep 11, 2024	Data AugmentationImage-to-Image Translation	CodeCode Available
Deep Learning Techniques for Hand Vein Biometrics: A Comprehensive Review	Sep 11, 2024	Data AugmentationDeep Learning	—Unverified
Enhancing Temporal Understanding in Audio Question Answering for Large Audio Language Models	Sep 10, 2024	Audio captioningAudio Question Answering	—Unverified
Automated Data Augmentation for Few-Shot Time Series Forecasting: A Reinforcement Learning Approach Guided by a Model Zoo	Sep 10, 2024	Data AugmentationDiversity	—Unverified
Keyword-Aware ASR Error Augmentation for Robust Dialogue State Tracking	Sep 10, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
EDADepth: Enhanced Data Augmentation for Monocular Depth Estimation	Sep 10, 2024	Data AugmentationDepth Estimation	CodeCode Available
Efficient Training of Self-Supervised Speech Foundation Models on a Compute Budget	Sep 9, 2024	Data AugmentationSelf-Supervised Learning	—Unverified
A Small Claims Court for the NLP: Judging Legal Text Classification Strategies With Small Datasets	Sep 9, 2024	Data AugmentationLanguage Modelling	—Unverified
Towards Building a Robust Knowledge Intensive Question Answering Model with Large Language Models	Sep 9, 2024	Contrastive LearningData Augmentation	—Unverified
Graffin: Stand for Tails in Imbalanced Node Classification	Sep 9, 2024	ClassificationData Augmentation	—Unverified
AD-Net: Attention-based dilated convolutional residual network with guided decoder for robust skin lesion segmentation	Sep 9, 2024	Data AugmentationDecoder	—Unverified
Enhanced Generative Data Augmentation for Semantic Segmentation via Stronger Guidance	Sep 9, 2024	Data AugmentationSegmentation	CodeCode Available
Exploring WavLM Back-ends for Speech Spoofing and Deepfake Detection	Sep 8, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
EdaCSC: Two Easy Data Augmentation Methods for Chinese Spelling Correction	Sep 8, 2024	Data AugmentationSpelling Correction	CodeCode Available
Efficient Classification of Histopathology Images	Sep 8, 2024	ClassificationData Augmentation	—Unverified
GS-PT: Exploiting 3D Gaussian Splatting for Comprehensive Point Cloud Understanding via Self-supervised Learning	Sep 8, 2024	3DGS3D Object Classification	—Unverified
Untie the Knots: An Efficient Data Augmentation Strategy for Long-Context Pre-Training in Language Models	Sep 7, 2024	Data Augmentation	—Unverified
Phrase-Level Adversarial Training for Mitigating Bias in Neural Network-based Automatic Essay Scoring	Sep 7, 2024	Data Augmentation	—Unverified
Medical Image Segmentation via Single-Source Domain Generalization with Random Amplitude Spectrum Synthesis	Sep 7, 2024	Data AugmentationDomain Generalization	CodeCode Available
A Quantitative Approach for Evaluating Disease Focus and Interpretability of Deep Learning Models for Alzheimer's Disease Classification	Sep 7, 2024	Data Augmentation	CodeCode Available
FreeAugment: Data Augmentation Search Across All Degrees of Freedom	Sep 7, 2024	AllData Augmentation	CodeCode Available
D4: Text-guided diffusion model-based domain adaptive data augmentation for vineyard shoot detection	Sep 6, 2024	Data AugmentationDiversity	—Unverified
Bi-modality Images Transfer with a Discrete Process Matching Method	Sep 6, 2024	Data AugmentationDiagnostic	—Unverified
Low-Complexity Own Voice Reconstruction for Hearables with an In-Ear Microphone	Sep 6, 2024	Data Augmentation	—Unverified
View-Invariant Policy Learning via Zero-Shot Novel View Synthesis	Sep 5, 2024	Data AugmentationNovel View Synthesis	—Unverified
PEPL: Precision-Enhanced Pseudo-Labeling for Fine-Grained Image Classification in Semi-Supervised Learning	Sep 5, 2024	Data AugmentationFine-Grained Image Classification	CodeCode Available
An Effective Deployment of Diffusion LM for Data Augmentation in Low-Resource Sentiment Classification	Sep 5, 2024	Data AugmentationDiversity	CodeCode Available
Convolutional Neural Networks for Automated Cellular Automaton Classification	Sep 4, 2024	ClassificationData Augmentation	—Unverified
Towards Data-Centric Face Anti-Spoofing: Improving Cross-domain Generalization via Physics-based Data Synthesis	Sep 4, 2024	Data AugmentationDomain Generalization	CodeCode Available
Adversarial Learning for Neural PDE Solvers with Sparse Data	Sep 4, 2024	Data Augmentation	—Unverified
A Comparative Study of Pre-training and Self-training	Sep 4, 2024	Data AugmentationNatural Language Inference	CodeCode Available
Reassessing Noise Augmentation Methods in the Context of Adversarial Speech	Sep 3, 2024	Adversarial RobustnessAutomatic Speech Recognition	—Unverified
Efficient Point Cloud Classification via Offline Distillation Framework and Negative-Weight Self-Distillation Technique	Sep 3, 2024	Data AugmentationKnowledge Distillation	—Unverified
Semantically Controllable Augmentations for Generalizable Robot Learning	Sep 2, 2024	Data AugmentationRobot Manipulation	—Unverified
LATEX-GCL: Large Language Models (LLMs)-Based Data Augmentation for Text-Attributed Graph Contrastive Learning	Sep 2, 2024	Contrastive LearningData Augmentation	—Unverified
IVGF: The Fusion-Guided Infrared and Visible General Framework	Sep 2, 2024	Data Augmentationobject-detection	—Unverified
A Review of Image Retrieval Techniques: Data Augmentation and Adversarial Learning Approaches	Sep 2, 2024	Data AugmentationImage Retrieval	—Unverified
Defending against Model Inversion Attacks via Random Erasing	Sep 2, 2024	Data Augmentationmodel	—Unverified
GCCRR: A Short Sequence Gait Cycle Segmentation Method Based on Ear-Worn IMU	Sep 2, 2024	Data Augmentationregression	—Unverified
Data Augmentation for Image Classification using Generative AI	Aug 31, 2024	ClassificationData Augmentation	—Unverified
Common Steps in Machine Learning Might Hinder The Explainability Aims in Medicine	Aug 30, 2024	Data AugmentationDimensionality Reduction	—Unverified
Rethinking Sparse Lexical Representations for Image Retrieval in the Age of Rising Multi-Modal Large Language Models	Aug 29, 2024	Data AugmentationImage Retrieval	—Unverified
LLMs vs Established Text Augmentation Techniques for Classification: When do the Benefits Outweight the Costs?	Aug 29, 2024	Data AugmentationText Augmentation	—Unverified
Flexible framework for generating synthetic electrocardiograms and photoplethysmograms	Aug 29, 2024	Data AugmentationElectrocardiography (ECG)	CodeCode Available

Show:10 25 50

← PrevPage 53 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified