Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3101–3150 of 4240 papers

Title	Date	Tasks	Status
Developing Multi-Task Recommendations with Long-Term Rewards via Policy Distilled Reinforcement Learning	Jan 27, 2020	Deep Reinforcement LearningKnowledge Distillation	—Unverified
Device-Directed Speech Detection: Regularization via Distillation for Weakly-Supervised Models	Mar 30, 2022	Knowledge Distillation	—Unverified
DeViT: Decomposing Vision Transformers for Collaborative Inference in Edge Devices	Sep 10, 2023	Collaborative InferenceGPU	—Unverified
DFMSD: Dual Feature Masking Stage-wise Knowledge Distillation for Object Detection	Jul 18, 2024	Knowledge DistillationObject	—Unverified
DFRD: Data-Free Robustness Distillation for Heterogeneous Federated Learning	Sep 24, 2023	Data-free Knowledge DistillationDiversity	—Unverified
DiagrammaticLearning: A Graphical Language for Compositional Training Regimes	Jan 2, 2025	Knowledge DistillationMulti-Task Learning	—Unverified
Dialect Identification through Adversarial Learning and Knowledge Distillation on Romanian BERT	Apr 1, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
DFM: Dialogue Foundation Model for Universal Large-Scale Dialogue-Oriented Task Learning	May 25, 2022	Dialogue GenerationDiversity	—Unverified
DiDOTS: Knowledge Distillation from Large-Language-Models for Dementia Obfuscation in Transcribed Speech	Oct 5, 2024	HallucinationKnowledge Distillation	—Unverified
Differentiable Feature Aggregation Search for Knowledge Distillation	Aug 2, 2020	Knowledge DistillationModel Compression	—Unverified
Diffusion Glancing Transformer for Parallel Sequence to Sequence Learning	Dec 20, 2022	Knowledge DistillationMachine Translation	—Unverified
Diffusion-Augmented Coreset Expansion for Scalable Dataset Distillation	Dec 5, 2024	Bilevel OptimizationComputational Efficiency	—Unverified
DiffusionTalker: Personalization and Acceleration for Speech-Driven 3D Face Diffuser	Nov 28, 2023	3D Face AnimationContrastive Learning	—Unverified
Digging Deeper into CRNN Model in Chinese Text Images Recognition	Nov 17, 2020	DenoisingKnowledge Distillation	—Unverified
Digital Twin-Assisted Knowledge Distillation Framework for Heterogeneous Federated Learning	Mar 10, 2023	Federated LearningKnowledge Distillation	—Unverified
DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation	Sep 22, 2024	Image GenerationKnowledge Distillation	—Unverified
DILEMMA: Joint LLM Quantization and Distributed LLM Inference Over Edge Computing Systems	Mar 3, 2025	Edge-computingKnowledge Distillation	—Unverified
DiPair: Fast and Accurate Distillation for Trillion-Scale Text Matching and Pair Modeling	Oct 7, 2020	Knowledge DistillationQuestion Answering	—Unverified
Direct Alignment of Draft Model for Speculative Decoding with Chat-Fine-Tuned LLMs	Feb 29, 2024	Dataset GenerationKnowledge Distillation	—Unverified
Direct Distillation between Different Domains	Jan 12, 2024	Domain AdaptationKnowledge Distillation	—Unverified
Direct Preference Knowledge Distillation for Large Language Models	Jun 28, 2024	Knowledge Distillation	—Unverified
DiReDi: Distillation and Reverse Distillation for AIoT Applications	Sep 12, 2024	Knowledge DistillationManagement	—Unverified
Disentanglement, Visualization and Analysis of Complex Features in DNNs	Jan 1, 2021	DisentanglementKnowledge Distillation	—Unverified
DistilDoc: Knowledge Distillation for Visually-Rich Document Applications	Jun 12, 2024	document-image-classificationDocument Image Classification	—Unverified
DualDE: Dually Distilling Knowledge Graph Embedding for Faster and Cheaper Reasoning	Sep 13, 2020	Graph EmbeddingKnowledge Distillation	—Unverified
Distill, Adapt, Distill: Training Small, In-Domain Models for Neural Machine Translation	Mar 5, 2020	Domain AdaptationKnowledge Distillation	—Unverified
Distill and De-bias: Mitigating Bias in Face Verification using Knowledge Distillation	Dec 17, 2021	AttributeFace Recognition	—Unverified
Knowledge Distillation Decision Tree for Unravelling Black-box Machine Learning Models	Jun 9, 2022	Knowledge Distillation	—Unverified
Distillation-Enabled Knowledge Alignment for Generative Semantic Communications in AIGC Provisioning Tasks	Jun 24, 2025	Knowledge DistillationSemantic Communication	—Unverified
Distillation-Enhanced Physical Adversarial Attacks	Jan 4, 2025	Adversarial AttackKnowledge Distillation	—Unverified
StableMamba: Distillation-free Scaling of Large SSMs for Images and Videos	Sep 18, 2024	Action Recognitionimage-classification	—Unverified
Distillation of Diffusion Features for Semantic Correspondence	Dec 4, 2024	3D ReconstructionData Augmentation	—Unverified
Distillation of Human-Object Interaction Contexts for Action Recognition	Dec 17, 2021	Action RecognitionGraph Attention	—Unverified
Distillation of Weighted Automata from Recurrent Neural Networks using a Spectral Approach	Sep 28, 2020	Knowledge DistillationLanguage Modelling	—Unverified
Distillation Using Oracle Queries for Transformer-Based Human-Object Interaction Detection	Jan 1, 2022	Data AugmentationDecoder	—Unverified
Distillation with Contrast is All You Need for Self-Supervised Point Cloud Representation Learning	Feb 9, 2022	AllContrastive Learning	—Unverified
Distilled ChatGPT Topic & Sentiment Modeling with Applications in Finance	Mar 4, 2024	Knowledge DistillationSentiment Analysis	—Unverified
Improving Word Embedding Factorization for Compression Using Distilled Nonlinear Neural Decomposition	Oct 2, 2019	Knowledge DistillationLanguage Modeling	—Unverified
Distilled embedding: non-linear embedding factorization using knowledge distillation	Sep 25, 2019	Knowledge DistillationMachine Translation	—Unverified
Distilled Mid-Fusion Transformer Networks for Multi-Modal Human Activity Recognition	May 5, 2023	Activity RecognitionFeature Engineering	—Unverified
Distilled Reverse Attention Network for Open-world Compositional Zero-Shot Learning	Mar 1, 2023	Compositional Zero-Shot LearningKnowledge Distillation	—Unverified
Distilling 3D distinctive local descriptors for 6D pose estimation	Mar 19, 2025	6D Pose EstimationKnowledge Distillation	—Unverified
Distilling a Deep Neural Network into a Takagi-Sugeno-Kang Fuzzy Inference System	Oct 10, 2020	General ClassificationKnowledge Distillation	—Unverified
Distilling Adversarial Robustness Using Heterogeneous Teachers	Feb 23, 2024	Adversarial RobustnessKnowledge Distillation	—Unverified
Distilling Calibrated Student from an Uncalibrated Teacher	Feb 22, 2023	Data AugmentationKnowledge Distillation	—Unverified
Distilling CLIP with Dual Guidance for Learning Discriminative Human Body Shape Representation	Jan 1, 2024	Knowledge DistillationPerson Re-Identification	—Unverified
Augmenting Offline Reinforcement Learning with State-only Interactions	Feb 1, 2024	D4RLData Augmentation	—Unverified
Distilling Cross-Temporal Contexts for Continuous Sign Language Recognition	Jan 1, 2023	Knowledge DistillationSign Language Recognition	—Unverified
Distilling EEG Representations via Capsules for Affective Computing	Apr 30, 2021	EEGElectroencephalogram (EEG)	—Unverified
Distilling Efficient Vision Transformers from CNNs for Semantic Segmentation	Oct 11, 2023	Knowledge DistillationSemantic Segmentation	—Unverified

Show:10 25 50

← PrevPage 63 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified