Dataset Distillation

Dataset distillation is the task of synthesizing a small dataset such that models trained on it achieve high performance on the original large dataset. A dataset distillation algorithm takes as input a large real dataset to be distilled (training set), and outputs a small synthetic distilled dataset, which is evaluated via testing models trained on this distilled dataset on a separate real dataset (validation/test set). A good small distilled dataset is not only useful in dataset understanding, but has various applications (e.g., continual learning, privacy, neural architecture search, etc.).

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 216 papers

Title	Date	Tasks	Status	Hype
Label Poisoning is All You Need	Oct 29, 2023	AllBackdoor Attack	CodeCode Available	1
Linear Mode Connectivity in Sparse Neural Networks	Oct 28, 2023	Dataset DistillationLinear Mode Connectivity	—Unverified	0
DREAM+: Efficient Dataset Distillation by Bidirectional Representative Matching	Oct 23, 2023	Dataset DistillationTransfer Learning	CodeCode Available	1
AST: Effective Dataset Distillation through Alignment with Smooth and High-Quality Expert Trajectories	Oct 16, 2023	Dataset Distillation	CodeCode Available	0
Does Graph Distillation See Like Vision Dataset Counterpart?	Oct 13, 2023	Anomaly DetectionDataset Distillation	CodeCode Available	1
Data Distillation Can Be Like Vodka: Distilling More Times For Better Quality	Oct 10, 2023	Dataset Distillation	—Unverified	0
Self-Supervised Dataset Distillation for Transfer Learning	Oct 10, 2023	Bilevel OptimizationDataset Distillation	CodeCode Available	1
Towards Lossless Dataset Distillation via Difficulty-Aligned Trajectory Matching	Oct 9, 2023	Dataset Distillation	CodeCode Available	1
Can pre-trained models assist in dataset distillation?	Oct 5, 2023	Dataset DistillationDiversity	CodeCode Available	1
DataDAM: Efficient Dataset Distillation with Attention Matching	Sep 29, 2023	Continual LearningDataset Distillation	CodeCode Available	1
FedGKD: Unleashing the Power of Collaboration in Federated Graph Neural Networks	Sep 18, 2023	Dataset Distillation	—Unverified	0
Multi-Source Domain Adaptation meets Dataset Distillation through Dataset Dictionary Learning	Sep 14, 2023	Dataset DistillationDictionary Learning	—Unverified	0
Towards Mitigating Architecture Overfitting on Distilled Datasets	Sep 8, 2023	Dataset DistillationKnowledge Distillation	CodeCode Available	0
Dataset Quantization	Aug 21, 2023	Dataset Distillationobject-detection	CodeCode Available	2
Vision-Language Dataset Distillation	Aug 15, 2023	Dataset Distillationimage-classification	CodeCode Available	1
Exploring Multilingual Text Data Distillation	Aug 9, 2023	Dataset DistillationFairness	CodeCode Available	0
Rethinking Data Distillation: Do Not Overlook Calibration	Jul 24, 2023	Dataset Distillation	—Unverified	0
Towards Trustworthy Dataset Distillation	Jul 18, 2023	Dataset Distillation	CodeCode Available	1
Dataset Distillation Meets Provable Subset Selection	Jul 16, 2023	Dataset Distillation	—Unverified	0
Squeeze, Recover and Relabel: Dataset Condensation at ImageNet Scale From A New Perspective	Jun 22, 2023	Bilevel OptimizationDataset Condensation	CodeCode Available	1
Towards Efficient Deep Hashing Retrieval: Condensing Your Data via Feature-Embedding Matching	May 29, 2023	Dataset CondensationDataset Distillation	—Unverified	0
Distill Gold from Massive Ores: Bi-level Data Pruning towards Efficient Dataset Distillation	May 28, 2023	Dataset Distillation	CodeCode Available	1
On the Size and Approximation Error of Distilled Sets	May 23, 2023	Dataset Distillationregression	—Unverified	0
A Comprehensive Study on Dataset Distillation: Performance, Privacy, Robustness and Fairness	May 5, 2023	BenchmarkingDataset Distillation	—Unverified	0
A Survey on Dataset Distillation: Approaches, Applications and Future Directions	May 3, 2023	Continual LearningDataset Distillation	—Unverified	0
Generalizing Dataset Distillation via Deep Generative Prior	May 2, 2023	Dataset Distillation	CodeCode Available	1
DiM: Distilling Dataset into Generative Model	Mar 8, 2023	Dataset Distillationmodel	CodeCode Available	1
Federated Virtual Learning on Heterogeneous Data with Local-global Distillation	Mar 4, 2023	Dataset DistillationFederated Learning	—Unverified	0
DREAM: Efficient Dataset Distillation by Representative Matching	Feb 28, 2023	Dataset DistillationDiversity	CodeCode Available	1
Evaluating the effect of data augmentation and BALD heuristics on distillation of Semantic-KITTI dataset	Feb 21, 2023	Active LearningAutonomous Driving	—Unverified	0
Navya3DSeg -- Navya 3D Semantic Segmentation Dataset & split generation for autonomous vehicles	Feb 16, 2023	3D Semantic SegmentationActive Learning	—Unverified	0
Dataset Distillation with Convexified Implicit Gradients	Feb 13, 2023	Dataset DistillationDataset Distillation - 1IPC	CodeCode Available	1
Understanding Reconstruction Attacks with the Neural Tangent Kernel and Dataset Distillation	Feb 2, 2023	Dataset DistillationReconstruction Attack	—Unverified	0
Dataset Distillation: A Comprehensive Review	Jan 17, 2023	Dataset CondensationDataset Distillation	—Unverified	0
A Comprehensive Survey of Dataset Distillation	Jan 13, 2023	Dataset DistillationMeta-Learning	—Unverified	0
Backdoor Attacks Against Dataset Distillation	Jan 3, 2023	Backdoor AttackDataset Distillation	CodeCode Available	1
Few-Shot Dataset Distillation via Translative Pre-Training	Jan 1, 2023	Dataset Distillation	—Unverified	0
Slimmable Dataset Condensation	Jan 1, 2023	Dataset CondensationDataset Distillation	—Unverified	0
On Implicit Bias in Overparameterized Bilevel Optimization	Dec 28, 2022	Bilevel OptimizationDataset Distillation	—Unverified	0
Accelerating Dataset Distillation via Model Augmentation	Dec 12, 2022	Dataset Distillationmodel	CodeCode Available	0
Minimizing the Accumulated Trajectory Error to Improve Dataset Distillation	Nov 20, 2022	Dataset DistillationDataset Distillation - 1IPC	CodeCode Available	1
Scaling Up Dataset Distillation to ImageNet-1K with Constant Memory	Nov 19, 2022	Dataset DistillationDataset Distillation - 1IPC	CodeCode Available	1
Dataset Factorization for Condensation	Nov 1, 2022	Dataset DistillationDiversity	CodeCode Available	1
Dataset Distillation via Factorization	Oct 30, 2022	Dataset DistillationHallucination	CodeCode Available	1
Efficient Dataset Distillation Using Random Feature Approximation	Oct 21, 2022	Dataset CondensationDataset Distillation	CodeCode Available	1
On Divergence Measures for Bayesian Pseudocoresets	Oct 12, 2022	Bayesian InferenceDataset Distillation	CodeCode Available	0
Dataset Distillation for Medical Dataset Sharing	Sep 29, 2022	Dataset Distillation	—Unverified	0
Compressed Gastric Image Generation Based on Soft-Label Dataset Distillation for Medical Data Sharing	Sep 29, 2022	Dataset DistillationImage Generation	—Unverified	0
Dataset Distillation Using Parameter Pruning	Sep 29, 2022	Dataset Distillation	—Unverified	0
The Curse of Unrolling: Rate of Differentiating Through Optimization	Sep 27, 2022	Dataset DistillationHyperparameter Optimization	—Unverified	0

Show:10 25 50

← PrevPage 4 of 5Next →

No leaderboard results yet.