Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1751–1800 of 8378 papers

Title	Date	Tasks	Status	Hype
JUICER: Data-Efficient Imitation Learning for Robotic Assembly	Apr 4, 2024	Data AugmentationImitation Learning	CodeCode Available	1
Mitigating analytical variability in fMRI results with style transfer	Apr 4, 2024	Data AugmentationStyle Transfer	—Unverified	0
If It's Not Enough, Make It So: Reducing Authentic Data Demand in Face Recognition through Synthetic Faces	Apr 4, 2024	Data AugmentationFace Recognition	—Unverified	0
Improving Topic Relevance Model by Mix-structured Summarization and LLM-based Data Augmentation	Apr 3, 2024	Data AugmentationLanguage Modeling	—Unverified	0
TSA on AutoPilot: Self-tuning Self-supervised Time Series Anomaly Detection	Apr 3, 2024	Anomaly DetectionData Augmentation	CodeCode Available	0
Low-resource neural machine translation with morphological modeling	Apr 3, 2024	Data AugmentationDecoder	CodeCode Available	0
MaiNLP at SemEval-2024 Task 1: Analyzing Source Language Selection in Cross-Lingual Textual Relatedness	Apr 3, 2024	Cross-Lingual TransferData Augmentation	—Unverified	0
Generative-Contrastive Heterogeneous Graph Neural Network	Apr 3, 2024	Contrastive LearningData Augmentation	CodeCode Available	0
Semantic Augmentation in Images using Language	Apr 2, 2024	Data AugmentationDeep Learning	—Unverified	0
Deep Neural Networks with 3D Point Clouds for Empirical Friction Measurements in Hydrodynamic Flood Models	Apr 2, 2024	Data AugmentationFriction	CodeCode Available	0
ContrastCAD: Contrastive Learning-based Representation Learning for Computer-Aided Design Models	Apr 2, 2024	Contrastive LearningData Augmentation	CodeCode Available	1
A Rationale-centric Counterfactual Data Augmentation Method for Cross-Document Event Coreference Resolution	Apr 2, 2024	coreference-resolutionCoreference Resolution	CodeCode Available	0
Towards Enhanced Analysis of Lung Cancer Lesions in EBUS-TBNA -- A Semi-Supervised Video Object Detection Method	Apr 2, 2024	Data AugmentationDiagnostic	—Unverified	0
AAdaM at SemEval-2024 Task 1: Augmentation and Adaptation for Multilingual Semantic Textual Relatedness	Apr 1, 2024	Cross-Lingual TransferData Augmentation	CodeCode Available	0
CAAP: Class-Dependent Automatic Data Augmentation Based On Adaptive Policies For Time Series	Apr 1, 2024	Data AugmentationTime Series	—Unverified	0
Source-Aware Training Enables Knowledge Attribution in Language Models	Apr 1, 2024	Data Augmentation	CodeCode Available	1
Harnessing The Power of Attention For Patch-Based Biomedical Image Classification	Apr 1, 2024	Data Augmentationimage-classification	—Unverified	0
Position-Aware Parameter Efficient Fine-Tuning Approach for Reducing Positional Bias in LLMs	Apr 1, 2024	Data Augmentationparameter-efficient fine-tuning	—Unverified	0
CoUDA: Coherence Evaluation via Unified Data Augmentation	Mar 31, 2024	Coherence EvaluationData Augmentation	CodeCode Available	0
Addressing Both Statistical and Causal Gender Fairness in NLP Models	Mar 30, 2024	counterfactualData Augmentation	CodeCode Available	0
Controllable and Diverse Data Augmentation with Large Language Model for Low-Resource Open-Domain Dialogue Generation	Mar 30, 2024	Data AugmentationDialogue Generation	—Unverified	0
CoDa: Constrained Generation based Data Augmentation for Low-Resource NLP	Mar 30, 2024	Data AugmentationInstruction Following	CodeCode Available	0
A Comprehensive Study on NLP Data Augmentation for Hate Speech Detection: Legacy Methods, BERT, and LLMs	Mar 30, 2024	Data AugmentationHate Speech Detection	—Unverified	0
Shortcuts Arising from Contrast: Effective and Covert Clean-Label Attacks in Prompt-Based Learning	Mar 30, 2024	Data AugmentationFew-Shot Text Classification	—Unverified	0
Colorful Cutout: Enhancing Image Data Augmentation with Curriculum Learning	Mar 29, 2024	Data Augmentation	CodeCode Available	0
Adverb Is the Key: Simple Text Data Augmentation with Adverb Deletion	Mar 29, 2024	Data AugmentationNatural Language Inference	CodeCode Available	0
A Data-Driven Predictive Analysis on Cyber Security Threats with Key Risk Factors	Mar 28, 2024	Data Augmentation	—Unverified	0
Boosting Cardiac Color Doppler Frame Rates with Deep Learning	Mar 28, 2024	Data AugmentationDeep Learning	—Unverified	0
Enhance Image Classification via Inter-Class Image Mixup with Diffusion Model	Mar 28, 2024	Data AugmentationDiversity	CodeCode Available	1
Towards Multimodal Video Paragraph Captioning Models Robust to Missing Modality	Mar 28, 2024	Data AugmentationDiversity	CodeCode Available	0
CAUSE: Counterfactual Assessment of User Satisfaction Estimation in Task-Oriented Dialogue Systems	Mar 27, 2024	counterfactualData Augmentation	—Unverified	0
Deep Fusion: Capturing Dependencies in Contrastive Learning via Transformer Projection Heads	Mar 27, 2024	Contrastive LearningData Augmentation	—Unverified	0
Mind the Domain Gap: a Systematic Analysis on Bioacoustic Sound Event Detection	Mar 27, 2024	Data AugmentationDomain Adaptation	CodeCode Available	2
GeNet: A Graph Neural Network-based Anti-noise Task-Oriented Semantic Communication Paradigm	Mar 27, 2024	Data AugmentationDecoder	CodeCode Available	1
Scaling Laws For Dense Retrieval	Mar 27, 2024	Data AugmentationRetrieval	CodeCode Available	0
Evaluating Large Language Models for Health-Related Text Classification Tasks with Public Social Media Data	Mar 27, 2024	Data Augmentationtext-classification	—Unverified	0
A vascular synthetic model for improved aneurysm segmentation and detection via Deep Neural Networks	Mar 27, 2024	Data Augmentation	—Unverified	0
Choreographing the Digital Canvas: A Machine Learning Approach to Artistic Performance	Mar 26, 2024	AttributeData Augmentation	—Unverified	0
Segment Any Medical Model Extended	Mar 26, 2024	Data AugmentationImage Segmentation	CodeCode Available	3
Semi-Supervised Image Captioning Considering Wasserstein Graph Matching	Mar 26, 2024	Data AugmentationGraph Matching	—Unverified	0
OCAI: Improving Optical Flow Estimation by Occlusion and Consistency Aware Interpolation	Mar 26, 2024	Data AugmentationMissing Values	—Unverified	0
Illuminating Blind Spots of Language Models with Targeted Agent-in-the-Loop Synthetic Data	Mar 26, 2024	Data Augmentation	—Unverified	0
The Solution for the CVPR 2023 1st foundation model challenge-Track2	Mar 26, 2024	AttributeData Augmentation	—Unverified	0
Calib3D: Calibrating Model Preferences for Reliable 3D Scene Understanding	Mar 25, 2024	Data AugmentationScene Understanding	CodeCode Available	2
Synthesize Step-by-Step: Tools, Templates and LLMs as Data Generators for Reasoning-Based Chart VQA	Mar 25, 2024	Chart Question AnsweringData Augmentation	—Unverified	0
SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation	Mar 25, 2024	Data AugmentationDenoising	—Unverified	0
Training Generative Adversarial Network-Based Vocoder with Limited Data Using Augmentation-Conditional Discriminator	Mar 25, 2024	Data AugmentationGenerative Adversarial Network	—Unverified	0
EG-ConMix: An Intrusion Detection Method based on Graph Contrastive Learning	Mar 24, 2024	Contrastive LearningData Augmentation	—Unverified	0
Are NeRFs ready for autonomous driving? Towards closing the real-to-simulation gap	Mar 24, 2024	Autonomous DrivingData Augmentation	—Unverified	0
Towards Channel-Resilient CSI-Based RF Fingerprinting using Deep Learning	Mar 23, 2024	Contrastive LearningData Augmentation	—Unverified	0

Show:10 25 50

← PrevPage 36 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified