Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3951–4000 of 8378 papers

Title	Date	Tasks	Status
Data Augmentation for Mathematical Objects	Jul 13, 2023	Data Augmentation	—Unverified
Data Augmentation for Machine Translation via Dependency Subtree Swapping	Jul 13, 2023	Data AugmentationMachine Translation	CodeCode Available
Single Domain Generalization via Normalised Cross-correlation Based Convolutions	Jul 12, 2023	Data AugmentationDomain Generalization	—Unverified
The Whole Pathological Slide Classification via Weakly Supervised Learning	Jul 12, 2023	ClassificationContrastive Learning	—Unverified
Diagnosis, Feedback, Adaptation: A Human-in-the-Loop Framework for Test-Time Policy Adaptation	Jul 12, 2023	continuous-controlContinuous Control	—Unverified
Data Augmentation in Training CNNs: Injecting Noise to Images	Jul 12, 2023	Data Augmentationimage-classification	—Unverified
Improved POS tagging for spontaneous, clinical speech using data augmentation	Jul 11, 2023	Data AugmentationPOS	—Unverified
RoPDA: Robust Prompt-based Data Augmentation for Low-Resource Named Entity Recognition	Jul 11, 2023	Data AugmentationLow Resource Named Entity Recognition	—Unverified
Q-YOLOP: Quantization-aware You Only Look Once for Panoptic Driving Perception	Jul 10, 2023	Autonomous DrivingData Augmentation	—Unverified
Optimal Transport Posterior Alignment for Cross-lingual Semantic Parsing	Jul 9, 2023	Data AugmentationSemantic Parsing	CodeCode Available
Robust Learning-Based Incipient Slip Detection using the PapillArray Optical Tactile Sensor for Improved Robotic Gripping	Jul 8, 2023	Data Augmentation	—Unverified
GEANN: Scalable Graph Augmentations for Multi-Horizon Time Series Forecasting	Jul 7, 2023	Data AugmentationDecoder	—Unverified
Blocks2World: Controlling Realistic Scenes with Editable Primitives	Jul 7, 2023	Data Augmentation	—Unverified
TBGC: Task-level Backbone-Oriented Gradient Clip for Multi-Task Foundation Model Learning	Jul 7, 2023	Data AugmentationMulti-Task Learning	—Unverified
ADASSM: Adversarial Data Augmentation in Statistical Shape Models From Images	Jul 6, 2023	AnatomyData Augmentation	—Unverified
LEA: Improving Sentence Similarity Robustness to Typos Using Lexical Attention Bias	Jul 6, 2023	Data AugmentationNatural Language Inference	CodeCode Available
Using Data Augmentations and VTLN to Reduce Bias in Dutch End-to-End Speech Recognition Systems	Jul 5, 2023	AnatomyData Augmentation	—Unverified
Beyond Known Reality: Exploiting Counterfactual Explanations for Medical Research	Jul 5, 2023	counterfactualData Augmentation	CodeCode Available
PULSAR at MEDIQA-Sum 2023: Large Language Models Augmented by Synthetic Dialogue Convert Patient Dialogues to Medical Records	Jul 5, 2023	Data AugmentationLanguage Modeling	CodeCode Available
Learning to Augment: Hallucinating Data for Domain Generalized Segmentation	Jul 4, 2023	Data AugmentationImage Enhancement	—Unverified
SleepEGAN: A GAN-enhanced Ensemble Deep Learning Model for Imbalanced Classification of Sleep Stages	Jul 4, 2023	Automatic Sleep Stage ClassificationClassification	—Unverified
Beyond Conservatism: Diffusion Policies in Offline Multi-agent Reinforcement Learning	Jul 4, 2023	Data AugmentationDiversity	—Unverified
Prompt Tuning Pushes Farther, Contrastive Learning Pulls Closer: A Two-Stage Approach to Mitigate Social Biases	Jul 4, 2023	Contrastive Learningcounterfactual	—Unverified
ENGAGE: Explanation Guided Data Augmentation for Graph Representation Learning	Jul 3, 2023	Contrastive LearningData Augmentation	CodeCode Available
Dynamical Graph Echo State Networks with Snapshot Merging for Dissemination Process Classification	Jul 3, 2023	ClassificationData Augmentation	—Unverified
SUGAR: Spherical Ultrafast Graph Attention Framework for Cortical Surface Registration	Jul 2, 2023	Computational EfficiencyData Augmentation	—Unverified
CNN-BiLSTM model for English Handwriting Recognition: Comprehensive Evaluation on the IAM Dataset	Jul 2, 2023	Data AugmentationHandwriting Recognition	—Unverified
ARHNet: Adaptive Region Harmonization for Lesion-aware Augmentation to Improve Segmentation Performance	Jul 2, 2023	Data AugmentationImage Harmonization	CodeCode Available
SysNoise: Exploring and Benchmarking Training-Deployment System Inconsistency	Jul 1, 2023	BenchmarkingData Augmentation	—Unverified
Long-Tailed Continual Learning For Visual Food Recognition	Jul 1, 2023	Continual LearningData Augmentation	—Unverified
Decoding Taste Information in Human Brain: A Temporal and Spatial Reconstruction Data Augmentation Method Coupled with Taste EEG	Jul 1, 2023	Data AugmentationEEG	—Unverified
Unsupervised Coordinate-Based Video Denoising	Jul 1, 2023	Data AugmentationDenoising	—Unverified
Hardwiring ViT Patch Selectivity into CNNs using Patch Mixing	Jun 30, 2023	Data AugmentationInductive Bias	—Unverified
Counterfactual Collaborative Reasoning	Jun 30, 2023	counterfactualCounterfactual Reasoning	—Unverified
EyeBAG: Accurate Control of Eye Blink and Gaze Based on Data Augmentation Leveraging Style Mixing	Jun 30, 2023	Data AugmentationFace Generation	—Unverified
DeepTagger: Knowledge Enhanced Named Entity Recognition for Web-Based Ads Queries	Jun 30, 2023	Data Augmentationnamed-entity-recognition	—Unverified
Navigating Noise: A Study of How Noise Influences Generalisation and Calibration of Neural Networks	Jun 30, 2023	Data Augmentation	CodeCode Available
GuidedMixup: An Efficient Mixup Strategy Guided by Saliency Maps	Jun 29, 2023	Data Augmentation	CodeCode Available
Generate Anything Anywhere in Any Scene	Jun 29, 2023	Data AugmentationObject	—Unverified
DialoGPS: Dialogue Path Sampling in Continuous Semantic Space for Data Augmentation in Multi-Turn Conversations	Jun 29, 2023	Data AugmentationDialogue Generation	—Unverified
Fused Gromov-Wasserstein Graph Mixup for Graph-level Classifications	Jun 28, 2023	Data Augmentation	CodeCode Available
Improving Primate Sounds Classification using Binary Presorting for Deep Learning	Jun 28, 2023	Data AugmentationDeep Learning	—Unverified
Semantic Positive Pairs for Enhancing Visual Representation Learning of Instance Discrimination methods	Jun 28, 2023	Contrastive LearningData Augmentation	—Unverified
Pseudo-Bag Mixup Augmentation for Multiple Instance Learning-Based Whole Slide Image Classification	Jun 28, 2023	ClassificationData Augmentation	—Unverified
Cross Spectral Image Reconstruction Using a Deep Guided Neural Network	Jun 27, 2023	Data AugmentationImage Reconstruction	CodeCode Available
Multi-perspective Information Fusion Res2Net with RandomSpecmix for Fake Speech Detection	Jun 27, 2023	Data Augmentation	—Unverified
Enhancing Representation Learning on High-Dimensional, Small-Size Tabular Data: A Divide and Conquer Method with Ensembled VAEs	Jun 27, 2023	Data AugmentationDimensionality Reduction	—Unverified
Using Large Language Models to Provide Explanatory Feedback to Human Tutors	Jun 27, 2023	Binary ClassificationData Augmentation	—Unverified
On the Usefulness of Synthetic Tabular Data Generation	Jun 27, 2023	Data AugmentationData Summarization	—Unverified
TranssionADD: A multi-frame reinforcement based sequence tagging model for audio deepfake detection	Jun 27, 2023	Audio Deepfake DetectionData Augmentation	—Unverified

Show:10 25 50

← PrevPage 80 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified