Data Augmentation

Data augmentation involves techniques used for increasing the amount of data, based on different modifications, to expand the amount of examples in the original dataset. Data augmentation not only helps to grow the dataset but it also increases the diversity of the dataset. When training machine learning models, data augmentation acts as a regularizer and helps to avoid overfitting.

Data augmentation techniques have been found useful in domains like NLP and computer vision. In computer vision, transformations like cropping, flipping, and rotation are used. In NLP, data augmentation techniques can include swapping, deletion, random insertion, among others.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1801–1850 of 8378 papers

Title	Date	Tasks	Status
A Time-Series Data Augmentation Model through Diffusion and Transformer Integration	May 1, 2025	Data AugmentationDenoising	—Unverified
The Illusion of Role Separation: Hidden Shortcuts in LLM Role Learning (and How to Fix Them)	May 1, 2025	Data Augmentation	—Unverified
Data-Driven Optical To Thermal Inference in Pool Boiling Using Generative Adversarial Networks	May 1, 2025	Data AugmentationGenerative Adversarial Network	—Unverified
Grokking in the Wild: Data Augmentation for Real-World Multi-Hop Reasoning with Transformers	Apr 29, 2025	Data AugmentationKnowledge Graphs	—Unverified
Enhancing LLM Language Adaption through Cross-lingual In-Context Pre-training	Apr 29, 2025	Cross-Lingual TransferData Augmentation	—Unverified
Light Weight CNN for classification of Brain Tumors from MRI Images	Apr 29, 2025	Data AugmentationDiagnostic	—Unverified
BrightCookies at SemEval-2025 Task 9: Exploring Data Augmentation for Food Hazard Classification	Apr 29, 2025	Data AugmentationText Augmentation	CodeCode Available
RV-Syn: Rational and Verifiable Mathematical Reasoning Data Synthesis based on Structured Function Library	Apr 29, 2025	Data AugmentationMathematical Reasoning	—Unverified
DiffusionRIR: Room Impulse Response Interpolation using Diffusion Models	Apr 29, 2025	Audio Signal ProcessingData Augmentation	—Unverified
Dual Attention Driven Lumbar Magnetic Resonance Image Feature Enhancement and Automatic Diagnosis of Herniation	Apr 28, 2025	Data AugmentationDiagnostic	—Unverified
Accurate and Diverse LLM Mathematical Reasoning via Automated PRM-Guided GFlowNets	Apr 28, 2025	Data AugmentationDiversity	—Unverified
ResearchCodeAgent: An LLM Multi-Agent System for Automated Codification of Research Methodologies	Apr 28, 2025	BenchmarkingData Augmentation	—Unverified
ProFi-Net: Prototype-based Feature Attention with Curriculum Augmentation for WiFi-based Gesture Recognition	Apr 28, 2025	Data AugmentationFew-Shot Learning	—Unverified
Improving Generalization in MRI-Based Deep Learning Models for Total Knee Replacement Prediction	Apr 27, 2025	Data AugmentationDeep Learning	—Unverified
SynLexLM: Scaling Legal LLMs with Synthetic Data and Curriculum Learning	Apr 26, 2025	Data AugmentationLegal Reasoning	—Unverified
MediAug: Exploring Visual Augmentation in Medical Imaging	Apr 26, 2025	Brain Tumor ClassificationData Augmentation	CodeCode Available
Outlier-aware Tensor Robust Principal Component Analysis with Self-guided Data Augmentation	Apr 25, 2025	Computational EfficiencyData Augmentation	—Unverified
Generative AI for Physical-Layer Authentication	Apr 25, 2025	Data AugmentationDenoising	—Unverified
CKMDiff: A Generative Diffusion Model for CKM Construction via Inverse Problems with Learned Priors	Apr 24, 2025	Data AugmentationDenoising	—Unverified
Occlusion-Aware Self-Supervised Monocular Depth Estimation for Weak-Texture Endoscopic Images	Apr 24, 2025	Data AugmentationDepth Estimation	—Unverified
DAPLSR: Data Augmentation Partial Least Squares Regression Model via Manifold Optimization	Apr 23, 2025	Data Augmentationregression	—Unverified
Assessing the Feasibility of Internet-Sourced Video for Automatic Cattle Lameness Detection	Apr 23, 2025	Data AugmentationDeep Learning	—Unverified
VLM-based Prompts as the Optimal Assistant for Unpaired Histopathology Virtual Staining	Apr 22, 2025	Data AugmentationVirtual Staining	CodeCode Available
Few-shot Hate Speech Detection Based on the MindSpore Framework	Apr 22, 2025	Data AugmentationHate Speech Detection	—Unverified
From Reviews to Dialogues: Active Synthesis for Zero-Shot LLM-based Conversational Recommender System	Apr 21, 2025	Active LearningData Augmentation	—Unverified
Diffusion Bridge Models for 3D Medical Image Translation	Apr 21, 2025	Data AugmentationDecision Making	—Unverified
From Dialect Gaps to Identity Maps: Tackling Variability in Speaker Verification	Apr 21, 2025	Data AugmentationSpeaker Identification	—Unverified
Enhancing DR Classification with Swin Transformer and Shifted Window Attention	Apr 20, 2025	Data AugmentationImage Cropping	—Unverified
Data Augmentation Using Neural Acoustic Fields With Retrieval-Augmented Pre-training	Apr 19, 2025	Data AugmentationRetrieval	—Unverified
Beyond One-Hot Labels: Semantic Mixing for Model Calibration	Apr 18, 2025	Data Augmentation	CodeCode Available
Effective Dual-Region Augmentation for Reduced Reliance on Large Amounts of Labeled Data	Apr 17, 2025	Data AugmentationDiversity	CodeCode Available
LIFT+: Lightweight Fine-Tuning for Long-Tail Learning	Apr 17, 2025	Data AugmentationLong-tail Learning	CodeCode Available
MathPhys-Guided Coarse-to-Fine Anomaly Synthesis with SQE-Driven Bi-Level Optimization for Anomaly Detection	Apr 17, 2025	Anomaly DetectionData Augmentation	—Unverified
ACoRN: Noise-Robust Abstractive Compression in Retrieval-Augmented Language Models	Apr 17, 2025	Data AugmentationRAG	—Unverified
Crossing the Human-Robot Embodiment Gap with Sim-to-Real RL using One Human Demonstration	Apr 17, 2025	Data AugmentationHuman-Object Interaction Detection	—Unverified
Benchmarking Audio Deepfake Detection Robustness in Real-world Communication Scenarios	Apr 16, 2025	Audio Deepfake DetectionBenchmarking	—Unverified
CDUPatch: Color-Driven Universal Adversarial Patch Attack for Dual-Modal Visible-Infrared Detectors	Apr 15, 2025	Data Augmentationobject-detection	—Unverified
MASSeg : 2nd Technical Report for 4th PVUW MOSE Track	Apr 14, 2025	Data AugmentationObject	CodeCode Available
VAE-based Feature Disentanglement for Data Augmentation and Compression in Generalized GNSS Interference Classification	Apr 14, 2025	Data AugmentationData Compression	—Unverified
Decoupled Diffusion Sparks Adaptive Scene Generation	Apr 14, 2025	Autonomous DrivingData Augmentation	—Unverified
Improving In-Context Learning with Reasoning Distillation	Apr 14, 2025	ARCData Augmentation	CodeCode Available
Data Augmentation Through Random Style Replacement	Apr 14, 2025	Data AugmentationStyle Transfer	—Unverified
Towards contrast- and pathology-agnostic clinical fetal brain MRI segmentation using SynthSeg	Apr 14, 2025	Data AugmentationMRI segmentation	—Unverified
Dual-Path Enhancements in Event-Based Eye Tracking: Augmented Robustness and Adaptive Temporal Modeling	Apr 14, 2025	Data Augmentation	—Unverified
Mitigating Long-tail Distribution in Oracle Bone Inscriptions: Dataset, Model, and Benchmark	Apr 13, 2025	Data AugmentationDenoising	—Unverified
Span-level Emotion-Cause-Category Triplet Extraction with Instruction Tuning LLMs and Data Augmentation	Apr 13, 2025	Data AugmentationEmotion-Cause Pair Extraction	CodeCode Available
Ges3ViG: Incorporating Pointing Gestures into Language-Based 3D Visual Grounding for Embodied Reference Understanding	Apr 13, 2025	3D visual groundingData Augmentation	CodeCode Available
seg2med: a bridge from artificial anatomy to multimodal medical images	Apr 12, 2025	AnatomyData Augmentation	—Unverified
Diffusion Models for Robotic Manipulation: A Survey	Apr 11, 2025	Data AugmentationImage Augmentation	—Unverified
MedRep: Medical Concept Representation for General Electronic Health Record Foundation Models	Apr 11, 2025	Data AugmentationLanguage Modeling	CodeCode Available

Show:10 25 50

← PrevPage 37 of 168Next →

All datasets ImageNet CIFAR-10 GA1457

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DeiT-B (+MixPro)	Accuracy (%)	82.9	—	Unverified
2	ResNet-200 (DeepAA)	Accuracy (%)	81.32	—	Unverified
3	DeiT-S (+MixPro)	Accuracy (%)	81.3	—	Unverified
4	ResNet-200 (Fast AA)	Accuracy (%)	80.6	—	Unverified
5	ResNet-200 (UA)	Accuracy (%)	80.4	—	Unverified
6	ResNet-200 (AA)	Accuracy (%)	80	—	Unverified
7	ResNet-50 (DeepAA)	Accuracy (%)	78.3	—	Unverified
8	ResNet-50 (TA wide)	Accuracy (%)	78.07	—	Unverified
9	ResNet-50 (LoRot-E)	Accuracy (%)	77.72	—	Unverified
10	ResNet-50 (LoRot-I)	Accuracy (%)	77.71	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	WideResNet-40-2 (Faster AA)	Percentage error	3.7	—	Unverified
2	Shake-Shake (26 2×32d) (Faster AA)	Percentage error	2.7	—	Unverified
3	WideResNet-28-10 (Faster AA)	Percentage error	2.6	—	Unverified
4	Shake-Shake (26 2×112d) (Faster AA)	Percentage error	2	—	Unverified
5	Shake-Shake (26 2×96d) (Faster AA)	Percentage error	2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	DiffAug	Classification Accuracy	92.7	—	Unverified
2	PaCMAP	Classification Accuracy	85.3	—	Unverified
3	hNNE	Classification Accuracy	77.4	—	Unverified
4	TopoAE	Classification Accuracy	74.6	—	Unverified