Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–450 of 8378 papers

Title	Date	Tasks	Status	Hype
Rethinking Few-Shot Medical Image Segmentation by SAM2: A Training-Free Framework with Augmentative Prompting and Dynamic Matching	Mar 5, 2025	Data AugmentationFew-Shot Learning	—Unverified	0
DeepGrav: Anomalous Gravitational-Wave Detection Through Deep Latent Features	Mar 5, 2025	Anomaly DetectionData Augmentation	CodeCode Available	0
Synthetic Data Augmentation for Enhancing Harmful Algal Bloom Detection with Machine Learning	Mar 5, 2025	Data Augmentation	CodeCode Available	0
Augmentation-Based Deep Learning for Identification of Circulating Tumor Cells	Mar 5, 2025	Data AugmentationDiagnostic	—Unverified	0
TopoMortar: A dataset to evaluate image segmentation methods focused on topology accuracy	Mar 5, 2025	AttributeData Augmentation	CodeCode Available	0
Effective LLM Knowledge Learning via Model Generalization	Mar 5, 2025	Data Augmentationmodel	—Unverified	0
Automatic Drywall Analysis for Progress Tracking and Quality Control in Construction	Mar 5, 2025	Data AugmentationInstance Segmentation	—Unverified	0
Towards Robust Universal Information Extraction: Benchmark, Evaluation, and Solution	Mar 5, 2025	Data AugmentationUIE	—Unverified	0
Exploring Token-Level Augmentation in Vision Transformer for Semi-Supervised Semantic Segmentation	Mar 4, 2025	Data AugmentationDiversity	CodeCode Available	0
Memorize or Generalize? Evaluating LLM Code Generation with Evolved Questions	Mar 4, 2025	Code GenerationData Augmentation	—Unverified	0
Class-Aware PillarMix: Can Mixed Sample Data Augmentation Enhance 3D Object Detection with Radar Point Clouds?	Mar 4, 2025	3D Object DetectionData Augmentation	—Unverified	0
Limited Effectiveness of LLM-based Data Augmentation for COVID-19 Misinformation Stance Detection	Mar 4, 2025	Data AugmentationMisinformation	—Unverified	0
BRIDGE: Bootstrapping Text to Control Time-Series Generation via Multi-Agent Iterative Optimization and Diffusion Modeling	Mar 4, 2025	counterfactualData Augmentation	—Unverified	0
A Generalized Theory of Mixup for Structure-Preserving Synthetic Data	Mar 3, 2025	Data Augmentation	CodeCode Available	0
Data Augmentation for NeRFs in the Low Data Limit	Mar 3, 2025	Data AugmentationNeRF	—Unverified	0
Composed Multi-modal Retrieval: A Survey of Approaches and Applications	Mar 3, 2025	Cross-Modal RetrievalData Augmentation	CodeCode Available	2
Random Walks in Self-supervised Learning for Triangular Meshes	Mar 2, 2025	ClusteringContrastive Learning	—Unverified	0
AI-Augmented Thyroid Scintigraphy for Robust Classification	Mar 1, 2025	ClassificationData Augmentation	—Unverified	0
UoR-NCL at SemEval-2025 Task 1: Using Generative LLMs and CLIP Models for Multilingual Multimodal Idiomaticity Representation	Feb 28, 2025	Contrastive LearningData Augmentation	CodeCode Available	0
MIDAS: Mixing Ambiguous Data with Soft Labels for Dynamic Facial Expression Recognition	Feb 28, 2025	Data AugmentationDynamic Facial Expression Recognition	—Unverified	0
A data augmentation strategy for deep neural networks with application to epidemic modelling	Feb 28, 2025	Data Augmentation	—Unverified	0
Style Content Decomposition-based Data Augmentation for Domain Generalizable Medical Image Segmentation	Feb 28, 2025	Data AugmentationImage Segmentation	CodeCode Available	0
Teaching Dense Retrieval Models to Specialize with Listwise Distillation and LLM Data Augmentation	Feb 27, 2025	Data AugmentationDomain Generalization	CodeCode Available	0
Order Doesn't Matter, But Reasoning Does: Training LLMs with Order-Centric Augmentation	Feb 27, 2025	Data AugmentationLogical Reasoning	—Unverified	0
Learning with Exact Invariances in Polynomial Time	Feb 27, 2025	Data Augmentationregression	—Unverified	0
cMIM: A Contrastive Mutual Information Framework for Unified Generative and Discriminative Representation Learning	Feb 27, 2025	Contrastive LearningData Augmentation	—Unverified	0
ColorDynamic: Generalizable, Scalable, Real-time, End-to-end Local Planner for Unstructured and Dynamic Environments	Feb 27, 2025	Data AugmentationDeep Reinforcement Learning	CodeCode Available	1
Language-Informed Hyperspectral Image Synthesis for Imbalanced-Small Sample Classification via Semi-Supervised Conditional Diffusion Model	Feb 27, 2025	Data AugmentationHyperspectral Image Classification	—Unverified	0
SCA3D: Enhancing Cross-modal 3D Retrieval via 3D Shape and Caption Paired Data Augmentation	Feb 26, 2025	Contrastive LearningData Augmentation	CodeCode Available	0
Easy-Poly: A Easy Polyhedral Framework For 3D Multi-Object Tracking	Feb 25, 2025	3D Multi-Object TrackingAutonomous Driving	—Unverified	0
Graph Augmentation for Cross Graph Domain Generalization	Feb 25, 2025	Data AugmentationDomain Generalization	—Unverified	0
Robust Polyp Detection and Diagnosis through Compositional Prompt-Guided Diffusion Models	Feb 25, 2025	Data AugmentationImage Generation	—Unverified	0
Your Language Model May Think Too Rigidly: Achieving Reasoning Consistency with Symmetry-Enhanced Training	Feb 25, 2025	Arithmetic ReasoningData Augmentation	—Unverified	0
Multi-Perspective Data Augmentation for Few-shot Object Detection	Feb 25, 2025	Data AugmentationFew-Shot Object Detection	CodeCode Available	1
MAGE: Multi-Head Attention Guided Embeddings for Low Resource Sentiment Classification	Feb 25, 2025	ClassificationData Augmentation	—Unverified	0
Iterative Counterfactual Data Augmentation	Feb 25, 2025	counterfactualData Augmentation	CodeCode Available	0
Contrastive Visual Data Augmentation	Feb 24, 2025	Data AugmentationNovel Concepts	—Unverified	0
GCC: Generative Color Constancy via Diffusing a Color Checker	Feb 24, 2025	Color ConstancyData Augmentation	—Unverified	0
Diffusion Models for Tabular Data: Challenges, Current Progress, and Future Directions	Feb 24, 2025	Data AugmentationImage Generation	CodeCode Available	2
On Neural Inertial Classification Networks for Pedestrian Activity Recognition	Feb 23, 2025	Activity RecognitionBenchmarking	—Unverified	0
SQLong: Enhanced NL2SQL for Longer Contexts with LLMs	Feb 23, 2025	Data Augmentation	—Unverified	0
Patch Stitching Data Augmentation for Cancer Classification in Pathology Images	Feb 22, 2025	Cancer ClassificationData Augmentation	—Unverified	0
Single Domain Generalization with Model-aware Parametric Batch-wise Mixup	Feb 22, 2025	Data AugmentationDomain Generalization	—Unverified	0
Physics-Informed Gradient Estimation for Accelerating Deep Learning based AC-OPF	Feb 22, 2025	Data AugmentationDeep Learning	—Unverified	0
USegMix: Unsupervised Segment Mix for Efficient Data Augmentation in Pathology Images	Feb 22, 2025	Cancer ClassificationData Augmentation	—Unverified	0
Enhancing LLMs for Identifying and Prioritizing Important Medical Jargons from Electronic Health Record Notes Utilizing Data Augmentation	Feb 22, 2025	Data Augmentation	—Unverified	0
SiMHand: Mining Similar Hands for Large-Scale 3D Hand Pose Pre-training	Feb 21, 2025	3D Hand Pose EstimationContrastive Learning	CodeCode Available	1
Mixup Model Merge: Enhancing Model Merging Performance through Randomized Linear Interpolation	Feb 21, 2025	Adversarial RobustnessData Augmentation	CodeCode Available	0
Inverse Surrogate Model of a Soft X-Ray Spectrometer using Domain Adaptation	Feb 21, 2025	Data AugmentationDomain Adaptation	—Unverified	0
Steganographic Embeddings as an Effective Data Augmentation	Feb 21, 2025	Data Augmentationimage-classification	CodeCode Available	0

Show:10 25 50

← PrevPage 9 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified