Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3951–4000 of 8378 papers

Title	Date	Tasks	Status	Hype
Unsupervised Data Augmentation for Aspect Based Sentiment Analysis	Oct 1, 2022	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	—Unverified	0
An Augmented Benchmark Dataset for Geometric Question Answering through Dual Parallel Text Encoding	Oct 1, 2022	Data AugmentationMath	—Unverified	0
ParaZh-22M: A Large-Scale Chinese Parabank via Machine Translation	Oct 1, 2022	Data AugmentationMachine Translation	—Unverified	0
Addressing Limitations of Encoder-Decoder Based Approach to Text-to-SQL	Oct 1, 2022	Data AugmentationDecoder	—Unverified	0
基于相似度进行句子选择的机器阅读理解数据增强(Machine reading comprehension data Augmentation for sentence selection based on similarity)	Oct 1, 2022	Data AugmentationMachine Reading Comprehension	—Unverified	0
Improving Event Temporal Relation Classification via Auxiliary Label-Aware Contrastive Learning	Oct 1, 2022	Contrastive LearningData Augmentation	—Unverified	0
MALM: Mixing Augmented Language Modeling for Zero-Shot Machine Translation	Oct 1, 2022	Data AugmentationLanguage Modeling	—Unverified	0
Automated segmentation of microvessels in intravascular OCT images using deep learning	Oct 1, 2022	Data AugmentationSegmentation	—Unverified	0
GraDA: Graph Generative Data Augmentation for Commonsense Reasoning	Oct 1, 2022	Data AugmentationHellaSwag	CodeCode Available	0
S2P: State-conditioned Image Synthesis for Data Augmentation in Offline Reinforcement Learning	Sep 30, 2022	Data AugmentationImage Generation	CodeCode Available	0
Using Knowledge Distillation to improve interpretable models in a retail banking context	Sep 30, 2022	Data AugmentationKnowledge Distillation	—Unverified	0
Domain Generalization -- A Causal Perspective	Sep 30, 2022	Data AugmentationDomain Generalization	—Unverified	0
Where Should I Spend My FLOPS? Efficiency Evaluations of Visual Pre-training Methods	Sep 30, 2022	Computational EfficiencyData Augmentation	—Unverified	0
Augmentation Backdoors	Sep 29, 2022	Data Augmentation	CodeCode Available	0
Automatic Data Augmentation via Invariance-Constrained Learning	Sep 29, 2022	Data AugmentationImage Classification	CodeCode Available	0
Contrastive Unsupervised Learning of World Model with Invariant Causal Features	Sep 29, 2022	Data AugmentationDepth Estimation	—Unverified	0
Prompt-guided Scene Generation for 3D Zero-Shot Learning	Sep 29, 2022	Contrastive LearningData Augmentation	—Unverified	0
Named Entity Recognition in Industrial Tables using Tabular Language Models	Sep 29, 2022	Data AugmentationInductive Bias	—Unverified	0
Strong Instance Segmentation Pipeline for MMSports Challenge	Sep 28, 2022	Data AugmentationInstance Segmentation	CodeCode Available	1
Synthesizing Annotated Image and Video Data Using a Rendering-Based Pipeline for Improved License Plate Recognition	Sep 28, 2022	Data AugmentationLicense Plate Recognition	—Unverified	0
Weighted Contrastive Hashing	Sep 28, 2022	Contrastive LearningData Augmentation	CodeCode Available	0
Data Augmentation using Feature Generation for Volumetric Medical Images	Sep 28, 2022	ClassificationData Augmentation	—Unverified	0
3D Rendering Framework for Data Augmentation in Optical Character Recognition	Sep 27, 2022	Data AugmentationOptical Character Recognition	—Unverified	0
Ani-GIFs: A benchmark dataset for domain generalization of action recognition from GIFs	Sep 26, 2022	Action RecognitionAnimated GIF Generation	—Unverified	0
TaskMix: Data Augmentation for Meta-Learning of Spoken Intent Understanding	Sep 26, 2022	Data AugmentationDiversity	—Unverified	0
On the Impact of Speech Recognition Errors in Passage Retrieval for Spoken Question Answering	Sep 26, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
Contrastive learning for unsupervised medical image clustering and reconstruction	Sep 24, 2022	ClusteringContrastive Learning	—Unverified	0
A Simple Strategy to Provable Invariance via Orbit Mapping	Sep 24, 2022	3D Point Cloud ClassificationComputational Efficiency	—Unverified	0
Towards Bridging the Space Domain Gap for Satellite Pose Estimation using Event Sensing	Sep 24, 2022	Data AugmentationDomain Adaptation	—Unverified	0
SR-GCL: Session-Based Recommendation with Global Context Enhanced Augmentation in Contrastive Learning	Sep 22, 2022	Contrastive LearningData Augmentation	—Unverified	0
AcroFOD: An Adaptive Method for Cross-domain Few-shot Object Detection	Sep 22, 2022	Cross-Domain Few-ShotCross-Domain Few-Shot Object Detection	CodeCode Available	1
StyleTime: Style Transfer for Synthetic Time Series Generation	Sep 22, 2022	Data AugmentationStyle Transfer	—Unverified	0
Semantically Consistent Data Augmentation for Neural Machine Translation via Conditional Masked Language Model	Sep 22, 2022	Data AugmentationDiversity	CodeCode Available	0
Scope of Pre-trained Language Models for Detecting Conflicting Health Information	Sep 22, 2022	Data Augmentation	—Unverified	0
Automated detection of Alzheimer disease using MRI images and deep neural networks- A review	Sep 22, 2022	Data AugmentationDeep Learning	—Unverified	0
NamedMask: Distilling Segmenters from Complementary Foundation Models	Sep 22, 2022	Data AugmentationObject	CodeCode Available	1
DARTSRepair: Core-failure-set Guided DARTS for Network Robustness to Common Corruptions	Sep 21, 2022	Data Augmentation	—Unverified	0
Understanding the Tricks of Deep Learning in Medical Image Segmentation: Challenges and Future Directions	Sep 21, 2022	Data AugmentationDomain Adaptation	CodeCode Available	2
Improving Generalizability of Graph Anomaly Detection Models via Data Augmentation	Sep 21, 2022	Anomaly DetectionData Augmentation	CodeCode Available	1
SynthA1c: Towards Clinically Interpretable Patient Representations for Diabetes Risk Stratification	Sep 20, 2022	Data AugmentationDiagnostic	CodeCode Available	0
High-resolution synthesis of high-density breast mammograms: Application to improved fairness in deep learning based mass detection	Sep 20, 2022	Breast Cancer DetectionData Augmentation	CodeCode Available	1
Vega-MT: The JD Explore Academy Translation System for WMT22	Sep 20, 2022	Data Augmentationde-en	CodeCode Available	1
Improving GANs with A Dynamic Discriminator	Sep 20, 2022	3D-Aware Image SynthesisData Augmentation	—Unverified	0
Exploring Inconsistent Knowledge Distillation for Object Detection with Data Augmentation	Sep 20, 2022	Data AugmentationKnowledge Distillation	CodeCode Available	0
Fairness in Face Presentation Attack Detection	Sep 19, 2022	AttributeData Augmentation	CodeCode Available	0
The Geometry of Self-supervised Learning Models and its Impact on Transfer Learning	Sep 18, 2022	Data AugmentationSelf-Supervised Learning	—Unverified	0
Intrinsically Motivated Reinforcement Learning based Recommendation with Counterfactual Data Augmentation	Sep 17, 2022	counterfactualData Augmentation	—Unverified	0
Can segmentation models be trained with fully synthetically generated data?	Sep 17, 2022	Data AugmentationEthics	—Unverified	0
Confidence-Guided Data Augmentation for Improved Semi-Supervised Training	Sep 16, 2022	Data Augmentationimage-classification	—Unverified	0
KaliCalib: A Framework for Basketball Court Registration	Sep 16, 2022	Camera CalibrationData Augmentation	—Unverified	0

Show:10 25 50

← PrevPage 80 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified