Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1401–1450 of 8378 papers

Title	Date	Tasks	Status	Hype
Explicit Diversity Conditions for Effective Question Answer Generation with Large Language Models	Jun 26, 2024	Answer GenerationData Augmentation	—Unverified	0
View-Invariant Pixelwise Anomaly Detection in Multi-object Scenes with Adaptive View Synthesis	Jun 26, 2024	Anomaly DetectionAnomaly Localization	—Unverified	0
Improving Grammatical Error Correction via Contextual Data Augmentation	Jun 25, 2024	Data AugmentationGrammatical Error Correction	CodeCode Available	0
Generative Expansion of Small Datasets: An Expansive Graph Approach	Jun 25, 2024	Data Augmentation	—Unverified	0
Sound Tagging in Infant-centric Home Soundscapes	Jun 25, 2024	Data AugmentationEvent Detection	—Unverified	0
Leveraging Synthetic Audio Data for End-to-End Low-Resource Speech Translation	Jun 25, 2024	Data AugmentationDiversity	—Unverified	0
MedMNIST-C: Comprehensive benchmark and improved classifier robustness by simulating realistic image corruptions	Jun 25, 2024	Data AugmentationDomain Generalization	CodeCode Available	1
Detection of Synthetic Face Images: Accuracy, Robustness, Generalization	Jun 25, 2024	Data Augmentation	—Unverified	0
Leveraging Knowledge Distillation for Lightweight Skin Cancer Classification: Balancing Accuracy and Computational Efficiency	Jun 24, 2024	Cancer ClassificationComputational Efficiency	—Unverified	0
MixTex: Unambiguous Recognition Should Not Rely Solely on Real Data	Jun 24, 2024	Data AugmentationOptical Character Recognition (OCR)	CodeCode Available	5
Meta-learning and Data Augmentation for Stress Testing Forecasting Models	Jun 24, 2024	Data AugmentationMeta-Learning	CodeCode Available	0
Convolutional neural network for Lyman break galaxies classification and redshift regression in DESI (Dark Energy Spectroscopic Instrument)	Jun 24, 2024	Bayesian OptimizationData Augmentation	—Unverified	0
Task Oriented In-Domain Data Augmentation	Jun 24, 2024	Data AugmentationMath	—Unverified	0
Improving robustness to corruptions with multiplicative weight perturbations	Jun 24, 2024	Data Augmentationimage-classification	CodeCode Available	0
UniPSDA: Unsupervised Pseudo Semantic Data Augmentation for Zero-Shot Cross-Lingual Natural Language Understanding	Jun 24, 2024	Data AugmentationNatural Language Understanding	CodeCode Available	0
Data Augmentation of Multi-turn Psychological Dialogue via Knowledge-driven Progressive Thought Prompting	Jun 24, 2024	Data AugmentationDialogue Generation	—Unverified	0
AutoDetect: Towards a Unified Framework for Automated Weakness Detection in Large Language Models	Jun 24, 2024	BenchmarkingData Augmentation	CodeCode Available	1
Evaluation and Comparison of Emotionally Evocative Image Augmentation Methods	Jun 23, 2024	Data AugmentationImage Augmentation	—Unverified	0
Pose-dIVE: Pose-Diversified Augmentation with Diffusion Model for Person Re-Identification	Jun 23, 2024	Data AugmentationDiversity	—Unverified	0
Self Training and Ensembling Frequency Dependent Networks with Coarse Prediction Pooling and Sound Event Bounding Boxes	Jun 22, 2024	Change DetectionData Augmentation	CodeCode Available	1
Multimodal Physiological Signals Representation Learning via Multiscale Contrasting for Depression Recognition	Jun 22, 2024	Data AugmentationEEG	—Unverified	0
RuleR: Improving LLM Controllability by Rule-based Data Recycling	Jun 22, 2024	Data AugmentationInstruction Following	CodeCode Available	1
PathoWAve: A Deep Learning-based Weight Averaging Method for Improving Domain Generalization in Histopathology Images	Jun 21, 2024	Data AugmentationDecision Making	CodeCode Available	0
Exploring Audio-Visual Information Fusion for Sound Event Localization and Detection In Low-Resource Realistic Scenarios	Jun 21, 2024	Data AugmentationSound Event Localization and Detection	—Unverified	0
From Overfitting to Robustness: Quantity, Quality, and Variety Oriented Negative Sample Selection in Graph Contrastive Learning	Jun 21, 2024	Contrastive LearningData Augmentation	—Unverified	0
Self-supervised Brain Lesion Generation for Effective Data Augmentation of Medical Images	Jun 21, 2024	Data AugmentationLesion Segmentation	—Unverified	0
Factual Dialogue Summarization via Learning from Large Language Models	Jun 20, 2024	Contrastive LearningData Augmentation	—Unverified	0
Voice Disorder Analysis: a Transformer-based Approach	Jun 20, 2024	Data AugmentationDiversity	CodeCode Available	1
Zero-Shot Image Denoising for High-Resolution Electron Microscopy	Jun 20, 2024	Data AugmentationDenoising	CodeCode Available	1
Urban-Focused Multi-Task Offline Reinforcement Learning with Contrastive Data Sharing	Jun 20, 2024	Autonomous DrivingData Augmentation	—Unverified	0
FIESTA: Fourier-Based Semantic Augmentation with Uncertainty Guidance for Enhanced Domain Generalizability in Medical Image Segmentation	Jun 20, 2024	Data AugmentationDomain Generalization	—Unverified	0
Advancing Fine-Grained Classification by Structure and Subject Preserving Augmentation	Jun 20, 2024	Data AugmentationDiversity	CodeCode Available	1
Self-Supervised Pretext Tasks for Alzheimer's Disease Classification using 3D Convolutional Neural Networks on Large-Scale Synthetic Neuroimaging Dataset	Jun 20, 2024	Data AugmentationImage Reconstruction	—Unverified	0
Improving Zero-Shot Cross-Lingual Transfer via Progressive Code-Switching	Jun 19, 2024	Cross-Lingual TransferData Augmentation	—Unverified	0
A New Approach for Evaluating and Improving the Performance of Segmentation Algorithms on Hard-to-Detect Blood Vessels	Jun 19, 2024	Data AugmentationSegmentation	CodeCode Available	0
Visually Robust Adversarial Imitation Learning from Videos with Contrastive Learning	Jun 18, 2024	Contrastive LearningData Augmentation	CodeCode Available	0
Skin Cancer Images Classification using Transfer Learning Techniques	Jun 18, 2024	Binary ClassificationClassification	—Unverified	0
Class-specific Data Augmentation for Plant Stress Classification	Jun 18, 2024	ClassificationData Augmentation	CodeCode Available	0
Composited-Nested-Learning with Data Augmentation for Nested Named Entity Recognition	Jun 18, 2024	Data Augmentationnamed-entity-recognition	—Unverified	0
Fighting Randomness with Randomness: Mitigating Optimisation Instability of Fine-Tuning using Delayed Ensemble and Noisy Interpolation	Jun 18, 2024	Computational EfficiencyData Augmentation	CodeCode Available	0
MMUTF: Multimodal Multimedia Event Argument Extraction with Unified Template Filling	Jun 18, 2024	Data AugmentationEvent Argument Extraction	—Unverified	0
Insect Identification in the Wild: The AMI Dataset	Jun 18, 2024	Data AugmentationDiversity	CodeCode Available	0
Agriculture-Vision Challenge 2024 -- The Runner-Up Solution for Agricultural Pattern Recognition via Class Balancing and Model Ensemble	Jun 18, 2024	Data AugmentationSegmentation	—Unverified	0
Depth Anywhere: Enhancing 360 Monocular Depth Estimation via Perspective Distillation and Unlabeled Data Augmentation	Jun 18, 2024	Autonomous NavigationData Augmentation	—Unverified	0
Is Your HD Map Constructor Reliable under Sensor Corruptions?	Jun 18, 2024	Autonomous DrivingData Augmentation	—Unverified	0
Self-Supervised Time-Series Anomaly Detection Using Learnable Data Augmentation	Jun 18, 2024	Anomaly DetectionContrastive Learning	—Unverified	0
Beyond Visual Appearances: Privacy-sensitive Objects Identification via Hybrid Graph Reasoning	Jun 18, 2024	Data AugmentationGraph Generation	—Unverified	0
Learn Beyond The Answer: Training Language Models with Reflection for Mathematical Reasoning	Jun 17, 2024	Data AugmentationMathematical Reasoning	CodeCode Available	2
Multispectral Snapshot Image Registration Using Learned Cross Spectral Disparity Estimation and a Deep Guided Occlusion Reconstruction Network	Jun 17, 2024	CPUData Augmentation	CodeCode Available	0
Deep Learning methodology for the identification of wood species using high-resolution macroscopic images	Jun 17, 2024	Data Augmentation	CodeCode Available	0

Show:10 25 50

← PrevPage 29 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified