Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2301–2350 of 8378 papers

Title	Date	Tasks	Status
Improving the performance of weak supervision searches using data augmentation	Nov 29, 2024	Data AugmentationDiversity	—Unverified
CantorNet: A Sandbox for Testing Geometrical and Topological Complexity Measures	Nov 29, 2024	Data Augmentation	—Unverified
Reverse Thinking Makes LLMs Stronger Reasoners	Nov 29, 2024	Data AugmentationKnowledge Distillation	—Unverified
Topology-Preserving Scaling in Data Augmentation	Nov 29, 2024	Data Augmentation	—Unverified
UrbanCAD: Towards Highly Controllable and Photorealistic 3D Vehicles for Urban Scene Simulation	Nov 28, 2024	3DGSAutonomous Driving	—Unverified
Data Augmentation with Diffusion Models for Colon Polyp Localization on the Low Data Regime: How much real data is enough?	Nov 28, 2024	Data AugmentationDeep Learning	—Unverified
Enhancing weed detection performance by means of GenAI-based image augmentation	Nov 27, 2024	Data AugmentationDiversity	—Unverified
Dual-Level Boost Network for Long-Tail Prohibited Items Detection in X-ray Security Inspection	Nov 27, 2024	Data Augmentation	—Unverified
Synthetic ECG Generation for Data Augmentation and Transfer Learning in Arrhythmia Classification	Nov 27, 2024	Data AugmentationRhythm	—Unverified
Thai Financial Domain Adaptation of THaLLE -- Technical Report	Nov 27, 2024	Data AugmentationDomain Adaptation	—Unverified
Task Progressive Curriculum Learning for Robust Visual Question Answering	Nov 26, 2024	Data AugmentationEnsemble Learning	—Unverified
Scaling nnU-Net for CBCT Segmentation	Nov 26, 2024	Data Augmentation	—Unverified
Breast Tumor Classification Using EfficientNet Deep Learning Model	Nov 26, 2024	Binary ClassificationCancer Classification	CodeCode Available
Semantic Data Augmentation for Long-tailed Facial Expression Recognition	Nov 26, 2024	Data AugmentationFacial Expression Recognition	—Unverified
SynDiff-AD: Improving Semantic Segmentation and End-to-End Autonomous Driving with Synthetic Data from Latent Diffusion Models	Nov 25, 2024	Autonomous DrivingData Augmentation	—Unverified
J-CaPA : Joint Channel and Pyramid Attention Improves Medical Image Segmentation	Nov 25, 2024	Data AugmentationImage Segmentation	—Unverified
Unsupervised Event Outlier Detection in Continuous Time	Nov 25, 2024	Anomaly DetectionData Augmentation	—Unverified
Enhancing Few-Shot Learning with Integrated Data and GAN Model Approaches	Nov 25, 2024	Data AugmentationDrug Discovery	—Unverified
RoCoDA: Counterfactual Data Augmentation for Data-Efficient Robot Learning from Demonstrations	Nov 25, 2024	counterfactualData Augmentation	—Unverified
A Novel Data Augmentation Tool for Enhancing Machine Learning Classification: A New Application of the Higher Order Dynamic Mode Decomposition for Improved Cardiac Disease Identification	Nov 24, 2024	Data Augmentation	—Unverified
Machine-agnostic Automated Lumbar MRI Segmentation using a Cascaded Model Based on Generative Neurons	Nov 23, 2024	Data AugmentationDecoder	—Unverified
Simplifying CLIP: Unleashing the Power of Large-Scale Models on Consumer-level Computers	Nov 22, 2024	Data AugmentationGPU	—Unverified
Reconciling Semantic Controllability and Diversity for Remote Sensing Image Synthesis with Hybrid Semantic Embedding	Nov 22, 2024	Data AugmentationDiversity	—Unverified
Towards Speaker Identification with Minimal Dataset and Constrained Resources using 1D-Convolution Neural Network	Nov 22, 2024	Data AugmentationSpeaker Identification	CodeCode Available
Evaluating LLM Prompts for Data Augmentation in Multi-label Classification of Ecological Texts	Nov 22, 2024	Data AugmentationMulti-Label Classification	—Unverified
MVANet: Multi-Stage Video Attention Network for Sound Event Localization and Detection with Source Distance Estimation	Nov 21, 2024	Data AugmentationSound Event Localization and Detection	CodeCode Available
Improving Routability Prediction via NAS Using a Smooth One-shot Augmented Predictor	Nov 21, 2024	Data AugmentationNeural Architecture Search	—Unverified
An Experimental Study on Data Augmentation Techniques for Named Entity Recognition on Low-Resource Domains	Nov 21, 2024	Data Augmentationnamed-entity-recognition	—Unverified
Next-Generation Phishing: How LLM Agents Empower Cyber Attackers	Nov 21, 2024	Data Augmentation	—Unverified
SynEHRgy: Synthesizing Mixed-Type Structured Electronic Health Records using Decoder-Only Transformers	Nov 20, 2024	Data AugmentationDecoder	—Unverified
Simulating Liquidity: Agent-Based Modeling of Illiquid Markets for Fractional Ownership	Nov 20, 2024	Data Augmentation	—Unverified
Conditional Distribution Learning on Graphs	Nov 20, 2024	Contrastive LearningData Augmentation	CodeCode Available
Hard-Synth: Synthesizing Diverse Hard Samples for ASR using Zero-Shot TTS and LLM	Nov 20, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
On the Way to LLM Personalization: Learning to Remember User Conversations	Nov 20, 2024	Data AugmentationRAG	—Unverified
Whisper Finetuning on Nepali Language	Nov 19, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Residual Vision Transformer (ResViT) Based Self-Supervised Learning Model for Brain Tumor Classification	Nov 19, 2024	Brain Tumor ClassificationData Augmentation	—Unverified
Balancing Accuracy and Efficiency in Multi-Turn Intent Classification for LLM-Powered Dialog Systems in Production	Nov 19, 2024	ClassificationData Augmentation	—Unverified
Can Open-source LLMs Enhance Data Synthesis for Toxic Detection?: An Experimental Study	Nov 18, 2024	Data AugmentationHallucination	—Unverified
Online Item Cold-Start Recommendation with Popularity-Aware Meta-Learning	Nov 18, 2024	Data AugmentationMeta-Learning	CodeCode Available
Wafer Map Defect Classification Using Autoencoder-Based Data Augmentation and Convolutional Neural Network	Nov 17, 2024	ClassificationData Augmentation	—Unverified
Variational Bayesian Bow tie Neural Networks with Shrinkage	Nov 17, 2024	Bayesian InferenceData Augmentation	CodeCode Available
LTCXNet: Advancing Chest X-Ray Analysis with Solutions for Long-Tailed Multi-Label Classification and Fairness Challenges	Nov 16, 2024	Data AugmentationDecoder	—Unverified
Improvement in Facial Emotion Recognition using Synthetic Data Generated by Diffusion Model	Nov 16, 2024	Data AugmentationEmotion Recognition	CodeCode Available
Enhancing PTSD Outcome Prediction with Ensemble Models in Disaster Contexts	Nov 16, 2024	Data Augmentation	—Unverified
Counterfactual Learning-Driven Representation Disentanglement for Search-Enhanced Recommendation	Nov 14, 2024	Collaborative Filteringcounterfactual	—Unverified
Are nuclear masks all you need for improved out-of-domain generalisation? A closer look at cancer classification in histopathology	Nov 14, 2024	AllCancer Classification	CodeCode Available
Bayesian estimation of finite mixtures of Tobit models	Nov 14, 2024	Data Augmentation	—Unverified
Generative AI for Data Augmentation in Wireless Networks: Analysis, Applications, and Case Study	Nov 13, 2024	Data AugmentationGesture Recognition	CodeCode Available
Optimal Transport-Based Displacement Interpolation with Data Augmentation for Reduced Order Modeling of Nonlinear Dynamical Systems	Nov 13, 2024	Data Augmentation	—Unverified
A Heterogeneous Graph Neural Network Fusing Functional and Structural Connectivity for MCI Diagnosis	Nov 13, 2024	Data AugmentationGraph Neural Network	—Unverified

Show:10 25 50

← PrevPage 47 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified