Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 751–800 of 8378 papers

Title	Date	Tasks	Status	Hype
EvTTC: An Event Camera Dataset for Time-to-Collision Estimation	Dec 6, 2024	Data Augmentation	—Unverified	0
Improving Post-Earthquake Crack Detection using Semi-Synthetic Generated Images	Dec 6, 2024	Data Augmentation	—Unverified	0
DEIM: DETR with Improved Matching for Fast Convergence	Dec 5, 2024	Data AugmentationGPU	CodeCode Available	5
BhashaVerse : Translation Ecosystem for Indian Subcontinent Languages	Dec 5, 2024	Automatic Post-EditingData Augmentation	—Unverified	0
Enhancing Mathematical Reasoning in LLMs with Background Operators	Dec 5, 2024	Data AugmentationMath	—Unverified	0
Few-Shot Learning with Adaptive Weight Masking in Conditional GANs	Dec 4, 2024	Data AugmentationDiversity	—Unverified	0
Channel Reflection: Knowledge-Driven Data Augmentation for EEG-Based Brain-Computer Interfaces	Dec 4, 2024	Brain Computer InterfaceData Augmentation	—Unverified	0
Distillation of Diffusion Features for Semantic Correspondence	Dec 4, 2024	3D ReconstructionData Augmentation	—Unverified	0
Tight PAC-Bayesian Risk Certificates for Contrastive Learning	Dec 4, 2024	Contrastive LearningData Augmentation	CodeCode Available	0
Variable-Speed Teaching-Playback as Real-World Data Augmentation for Imitation Learning	Dec 4, 2024	Data AugmentationImitation Learning	—Unverified	0
Curriculum-style Data Augmentation for LLM-based Metaphor Detection	Dec 4, 2024	Data Augmentation	—Unverified	0
GUESS: Generative Uncertainty Ensemble for Self Supervision	Dec 3, 2024	Data AugmentationSelf-Supervised Learning	—Unverified	0
Many-MobileNet: Multi-Model Augmentation for Robust Retinal Disease Classification	Dec 3, 2024	Computational EfficiencyData Augmentation	CodeCode Available	2
Evaluating the Impact of Data Augmentation on Predictive Model Performance	Dec 3, 2024	Data Augmentation	—Unverified	0
GenMix: Effective Data Augmentation with Generative Diffusion Model Image Editing	Dec 3, 2024	Adversarial RobustnessData Augmentation	—Unverified	0
Planning-Guided Diffusion Policy Learning for Generalizable Contact-Rich Bimanual Manipulation	Dec 3, 2024	Data Augmentation	—Unverified	0
Robust soybean seed yield estimation using high-throughput ground robot videos	Dec 3, 2024	Data Augmentation	—Unverified	0
ProbPose: A Probabilistic Approach to 2D Human Pose Estimation	Dec 3, 2024	2D Human Pose EstimationData Augmentation	CodeCode Available	2
Direct Coloring for Self-Supervised Enhanced Feature Decoupling	Dec 3, 2024	Data AugmentationRepresentation Learning	—Unverified	0
QA-TOOLBOX: Conversational Question-Answering for process task guidance in manufacturing	Dec 3, 2024	Conversational Question AnsweringData Augmentation	—Unverified	0
Su-RoBERTa: A Semi-supervised Approach to Predicting Suicide Risk through Social Media using Base Language Models	Dec 2, 2024	Data Augmentation	—Unverified	0
ECG-SleepNet: Deep Learning-Based Comprehensive Sleep Stage Classification Using ECG Signals	Dec 2, 2024	ClassificationData Augmentation	—Unverified	0
Multi-View Incongruity Learning for Multimodal Sarcasm Detection	Dec 1, 2024	Contrastive LearningData Augmentation	—Unverified	0
A Semi-Supervised Approach with Error Reflection for Echocardiography Segmentation	Dec 1, 2024	Data AugmentationImage Segmentation	—Unverified	0
Table Integration in Data Lakes Unleashed: Pairwise Integrability Judgment, Integrable Set Discovery, and Multi-Tuple Conflict Resolution	Nov 30, 2024	Community DetectionContrastive Learning	—Unverified	0
Improving speaker verification robustness with synthetic emotional utterances	Nov 30, 2024	Data AugmentationSpeaker Verification	—Unverified	0
BGM: Background Mixup for X-ray Prohibited Items Detection	Nov 30, 2024	Data AugmentationImage Augmentation	—Unverified	0
Improving the performance of weak supervision searches using data augmentation	Nov 29, 2024	Data AugmentationDiversity	—Unverified	0
T2Vid: Translating Long Text into Multi-Image is the Catalyst for Video-LLMs	Nov 29, 2024	Data AugmentationDiversity	CodeCode Available	1
Topology-Preserving Scaling in Data Augmentation	Nov 29, 2024	Data Augmentation	—Unverified	0
Towards Santali Linguistic Inclusion: Building the First Santali-to-English Translation Model using mT5 Transformer and Data Augmentation	Nov 29, 2024	Data AugmentationMachine Translation	—Unverified	0
Reverse Thinking Makes LLMs Stronger Reasoners	Nov 29, 2024	Data AugmentationKnowledge Distillation	—Unverified	0
CantorNet: A Sandbox for Testing Geometrical and Topological Complexity Measures	Nov 29, 2024	Data Augmentation	—Unverified	0
MaskRIS: Semantic Distortion-aware Data Augmentation for Referring Image Segmentation	Nov 28, 2024	Data AugmentationImage Segmentation	CodeCode Available	1
Data Augmentation with Diffusion Models for Colon Polyp Localization on the Low Data Regime: How much real data is enough?	Nov 28, 2024	Data AugmentationDeep Learning	—Unverified	0
UrbanCAD: Towards Highly Controllable and Photorealistic 3D Vehicles for Urban Scene Simulation	Nov 28, 2024	3DGSAutonomous Driving	—Unverified	0
Dual-Level Boost Network for Long-Tail Prohibited Items Detection in X-ray Security Inspection	Nov 27, 2024	Data Augmentation	—Unverified	0
Enhancing weed detection performance by means of GenAI-based image augmentation	Nov 27, 2024	Data AugmentationDiversity	—Unverified	0
Training and Evaluating Language Models with Template-based Data Generation	Nov 27, 2024	Data AugmentationMath	CodeCode Available	1
Thai Financial Domain Adaptation of THaLLE -- Technical Report	Nov 27, 2024	Data AugmentationDomain Adaptation	—Unverified	0
Synthetic ECG Generation for Data Augmentation and Transfer Learning in Arrhythmia Classification	Nov 27, 2024	Data AugmentationRhythm	—Unverified	0
Breast Tumor Classification Using EfficientNet Deep Learning Model	Nov 26, 2024	Binary ClassificationCancer Classification	CodeCode Available	0
Task Progressive Curriculum Learning for Robust Visual Question Answering	Nov 26, 2024	Data AugmentationEnsemble Learning	—Unverified	0
Scaling nnU-Net for CBCT Segmentation	Nov 26, 2024	Data Augmentation	—Unverified	0
Semantic Data Augmentation for Long-tailed Facial Expression Recognition	Nov 26, 2024	Data AugmentationFacial Expression Recognition	—Unverified	0
RoCoDA: Counterfactual Data Augmentation for Data-Efficient Robot Learning from Demonstrations	Nov 25, 2024	counterfactualData Augmentation	—Unverified	0
SynDiff-AD: Improving Semantic Segmentation and End-to-End Autonomous Driving with Synthetic Data from Latent Diffusion Models	Nov 25, 2024	Autonomous DrivingData Augmentation	—Unverified	0
J-CaPA : Joint Channel and Pyramid Attention Improves Medical Image Segmentation	Nov 25, 2024	Data AugmentationImage Segmentation	—Unverified	0
Enhancing Few-Shot Learning with Integrated Data and GAN Model Approaches	Nov 25, 2024	Data AugmentationDrug Discovery	—Unverified	0
Unsupervised Event Outlier Detection in Continuous Time	Nov 25, 2024	Anomaly DetectionData Augmentation	—Unverified	0

Show:10 25 50

← PrevPage 16 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified