Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4101–4150 of 8378 papers

Title	Date	Tasks	Status
ShuffleMix: Improving Representations via Channel-Wise Shuffle of Interpolated Hidden States	May 30, 2023	BenchmarkingData Augmentation	CodeCode Available
Data Augmentation Methods of Dynamic Model Identification for Harbor Maneuvers using Feedforward Neural Network	May 30, 2023	Data Augmentation	—Unverified
Improving Generalization for Multimodal Fake News Detection	May 29, 2023	Data AugmentationFake News Detection	CodeCode Available
Extrinsic Factors Affecting the Accuracy of Biomedical NER	May 29, 2023	Data Augmentationnamed-entity-recognition	—Unverified
On Counterfactual Data Augmentation Under Confounding	May 29, 2023	counterfactualData Augmentation	—Unverified
Data Augmentation for Low-Resource Keyphrase Generation	May 29, 2023	ArticlesData Augmentation	CodeCode Available
Augmenting Character Designers Creativity Using Generative Adversarial Networks	May 28, 2023	Data AugmentationTransfer Learning	—Unverified
Spot keywords from very noisy and mixed speech	May 28, 2023	Data AugmentationKeyword Spotting	—Unverified
Targeted Data Generation: Finding and Fixing Model Weaknesses	May 28, 2023	Data AugmentationNatural Language Inference	—Unverified
GIMM: InfoMin-Max for Automated Graph Contrastive Learning	May 27, 2023	Contrastive LearningData Augmentation	—Unverified
Disambiguated Lexically Constrained Neural Machine Translation	May 27, 2023	Data AugmentationMachine Translation	—Unverified
CREST: A Joint Framework for Rationalization and Counterfactual Text Generation	May 26, 2023	counterfactualData Augmentation	CodeCode Available
TADA: Task-Agnostic Dialect Adapters for English	May 26, 2023	Data Augmentation	CodeCode Available
Leveraging Domain Knowledge for Inclusive and Bias-aware Humanitarian Response Entry Classification	May 26, 2023	counterfactualData Augmentation	CodeCode Available
Double Descent and Overfitting under Noisy Inputs and Distribution Shift for Linear Denoisers	May 26, 2023	Data AugmentationDenoising	—Unverified
GDA: Generative Data Augmentation Techniques for Relation Extraction Tasks	May 26, 2023	Data AugmentationRelation	—Unverified
ParaAMR: A Large-Scale Syntactically Diverse Paraphrase Dataset by AMR Back-Translation	May 26, 2023	Abstract Meaning RepresentationData Augmentation	CodeCode Available
With a Little Push, NLI Models can Robustly and Efficiently Predict Faithfulness	May 26, 2023	Data AugmentationQuestion Generation	CodeCode Available
An Empirical Comparison of LM-based Question and Answer Generation Methods	May 26, 2023	Answer GenerationData Augmentation	—Unverified
SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended)	May 26, 2023	Data AugmentationIn-Context Learning	—Unverified
Dynamic Data Augmentation via MCTS for Prostate MRI Segmentation	May 25, 2023	Data AugmentationGPU	CodeCode Available
You Don't Have to Be Perfect to Be Amazing: Unveil the Utility of Synthetic Images	May 25, 2023	Data AugmentationImage Generation	—Unverified
OverPrompt: Enhancing ChatGPT through Efficient In-Context Learning	May 24, 2023	Data AugmentationFact Checking	CodeCode Available
ICDAR 2023 Competition on Robust Layout Segmentation in Corporate Documents	May 24, 2023	Data Augmentation	—Unverified
HARD: Hard Augmentations for Robust Distillation	May 24, 2023	Data AugmentationDomain Generalization	—Unverified
Cross-lingual Data Augmentation for Document-grounded Dialog Systems in Low Resource Languages	May 24, 2023	Data AugmentationDecoder	—Unverified
Getting Sick After Seeing a Doctor? Diagnosing and Mitigating Knowledge Conflicts in Event Temporal Reasoning	May 24, 2023	counterfactualData Augmentation	CodeCode Available
Iteratively Improving Speech Recognition and Voice Conversion	May 24, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Prompting Large Language Models for Counterfactual Generation: An Empirical Study	May 24, 2023	counterfactualData Augmentation	—Unverified
SmartTrim: Adaptive Tokens and Attention Pruning for Efficient Vision-Language Models	May 24, 2023	Data Augmentation	CodeCode Available
Conversational Recommendation as Retrieval: A Simple, Strong Baseline	May 23, 2023	Conversational RecommendationData Augmentation	—Unverified
Siamese Masked Autoencoders	May 23, 2023	Data AugmentationDecoder	—Unverified
Exploring Contrast Consistency of Open-Domain Question Answering Systems on Minimally Edited Questions	May 23, 2023	Data AugmentationLanguage Modeling	CodeCode Available
Enhancing Black-Box Few-Shot Text Classification with Prompt-Based Data Augmentation	May 23, 2023	Data AugmentationFew-Shot Text Classification	—Unverified
Sorted Convolutional Network for Achieving Continuous Rotational Invariance	May 23, 2023	Data Augmentationimage-classification	—Unverified
LLM-powered Data Augmentation for Enhanced Cross-lingual Performance	May 23, 2023	Data Augmentation	CodeCode Available
Understanding Compositional Data Augmentation in Typologically Diverse Morphological Inflection	May 23, 2023	AttributeData Augmentation	CodeCode Available
Revisiting Data Augmentation in Model Compression: An Empirical and Comprehensive Study	May 22, 2023	Data AugmentationKnowledge Distillation	—Unverified
Tokenized Graph Transformer with Neighborhood Augmentation for Node Classification in Large Graphs	May 22, 2023	Data AugmentationGraph Representation Learning	—Unverified
ConvBoost: Boosting ConvNets for Sensor-based Activity Recognition	May 22, 2023	Activity RecognitionData Augmentation	CodeCode Available
Distilling Robustness into Natural Language Inference Models with Domain-Targeted Augmentation	May 22, 2023	Data AugmentationKnowledge Distillation	—Unverified
Phased Data Augmentation for Training a Likelihood-Based Generative Model with Limited Data	May 22, 2023	Data Augmentation	—Unverified
Statistical Guarantees of Group-Invariant GANs	May 22, 2023	Data Augmentation	—Unverified
ColMix -- A Simple Data Augmentation Framework to Improve Object Detector Performance and Robustness in Aerial Images	May 22, 2023	Data AugmentationObject	—Unverified
Real-Aug: Realistic Scene Synthesis for LiDAR Augmentation in 3D Object Detection	May 22, 2023	3D Object DetectionData Augmentation	—Unverified
Subspace-Configurable Networks	May 22, 2023	Audio Signal ProcessingData Augmentation	CodeCode Available
Text Generation with Speech Synthesis for ASR Data Augmentation	May 22, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Self-Evolution Learning for Mixup: Enhance Data Augmentation on Few-Shot Text Classification Tasks	May 22, 2023	ClassificationData Augmentation	—Unverified
Improving Classifier Robustness through Active Generation of Pairwise Counterfactuals	May 22, 2023	counterfactualData Augmentation	—Unverified
Understanding the Effect of Data Augmentation on Knowledge Distillation	May 21, 2023	Data AugmentationKnowledge Distillation	—Unverified

Show:10 25 50

← PrevPage 83 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified