Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3451–3500 of 4240 papers

Title	Date	Tasks	Status
Feature Kernel Distillation	Sep 29, 2021	image-classificationImage Classification	—Unverified
Feature-map-level Online Adversarial Knowledge Distillation	Feb 5, 2020	Knowledge Distillation	—Unverified
Feature-Rich Audio Model Inversion for Data-Free Knowledge Distillation Towards General Sound Classification	Mar 14, 2023	Data-free Knowledge DistillationKnowledge Distillation	—Unverified
Feature Structure Distillation for BERT Transferring	Nov 16, 2021	Knowledge Distillation	—Unverified
FedAL: Black-Box Federated Knowledge Distillation Enabled by Adversarial Learning	Nov 28, 2023	Knowledge DistillationTransfer Learning	—Unverified
FedD2S: Personalized Data-Free Federated Knowledge Distillation	Feb 16, 2024	Data-free Knowledge DistillationFairness	—Unverified
FedDKD: Federated Learning with Decentralized Knowledge Distillation	May 2, 2022	Federated LearningKnowledge Distillation	—Unverified
FedDTG:Federated Data-Free Knowledge Distillation via Three-Player Generative Adversarial Networks	Jan 10, 2022	Data-free Knowledge DistillationFederated Learning	—Unverified
FedED: Federated Learning via Ensemble Distillation for Medical Relation Extraction	Nov 1, 2020	Federated LearningKnowledge Distillation	—Unverified
FedEFM: Federated Endovascular Foundation Model with Unseen Data	Jan 28, 2025	Federated LearningKnowledge Distillation	—Unverified
Federated Action Recognition on Heterogeneous Embedded Devices	Jul 18, 2021	Action RecognitionFederated Learning	—Unverified
Federated Bayesian Neural Regression: A Scalable Global Federated Gaussian Process	Jun 13, 2022	Federated LearningKnowledge Distillation	—Unverified
Federated Deconfounding and Debiasing Learning for Out-of-Distribution Generalization	May 8, 2025	AttributeBenchmarking	—Unverified
Federated Distillation: A Survey	Apr 2, 2024	Federated LearningKnowledge Distillation	—Unverified
Federated Ensemble Model-based Reinforcement Learning in Edge Computing	Sep 12, 2021	Autonomous Drivingcontinuous-control	—Unverified
Federated Fine-Tuning of LLMs: Framework Comparison and Research Directions	Jan 8, 2025	Federated LearningKnowledge Distillation	—Unverified
Federated Graph Learning with Graphless Clients	Nov 13, 2024	Graph LearningKnowledge Distillation	—Unverified
Federated Knowledge Transfer Fine-tuning Large Server Model with Resource-Constrained IoT Clients	Jul 7, 2024	Federated LearningKnowledge Distillation	—Unverified
Federated Learning for Data and Model Heterogeneity in Medical Imaging	Jul 31, 2023	Federated LearningKnowledge Distillation	—Unverified
Federated Learning on Non-iid Data via Local and Global Distillation	Jun 26, 2023	Federated LearningKnowledge Distillation	—Unverified
Federated Learning with Privacy-Preserving Ensemble Attention Distillation	Oct 16, 2022	Federated Learningimage-classification	—Unverified
Federated One-Shot Learning with Data Privacy and Objective-Hiding	Apr 29, 2025	Federated LearningInformation Retrieval	—Unverified
Federated Semi-Supervised Domain Adaptation via Knowledge Transfer	Jul 21, 2022	Domain AdaptationFederated Learning	—Unverified
Federated Unlearning with Knowledge Distillation	Jan 24, 2022	Federated LearningKnowledge Distillation	—Unverified
FedKD: Communication Efficient Federated Learning via Knowledge Distillation	Aug 30, 2021	Federated LearningKnowledge Distillation	—Unverified
Exploiting Label Skewness for Spiking Neural Networks in Federated Learning	Dec 23, 2024	Federated LearningKnowledge Distillation	—Unverified
FedQUIT: On-Device Federated Unlearning via a Quasi-Competent Virtual Teacher	Aug 14, 2024	Federated LearningKnowledge Distillation	—Unverified
FedRAD: Federated Robust Adaptive Distillation	Dec 2, 2021	Federated LearningKnowledge Distillation	—Unverified
FedSDD: Scalable and Diversity-enhanced Distillation for Model Aggregation in Federated Learning	Dec 28, 2023	DiversityFederated Learning	—Unverified
FedSKD: Aggregation-free Model-heterogeneous Federated Learning using Multi-dimensional Similarity Knowledge Distillation	Mar 23, 2025	Federated LearningKnowledge Distillation	—Unverified
FedSPLIT: One-Shot Federated Recommendation System Based on Non-negative Joint Matrix Factorization and Knowledge Distillation	May 4, 2022	Collaborative FilteringFederated Learning	—Unverified
FedTAD: Topology-aware Data-free Knowledge Distillation for Subgraph Federated Learning	Apr 22, 2024	Data-free Knowledge DistillationFederated Learning	—Unverified
FedUD: Exploiting Unaligned Data for Cross-Platform Federated Click-Through Rate Prediction	Jul 26, 2024	Click-Through Rate PredictionFederated Learning	—Unverified
FEED: Feature-level Ensemble Effect for knowledge Distillation	May 1, 2019	Knowledge DistillationTransfer Learning	—Unverified
FEED: Feature-level Ensemble for Knowledge Distillation	Sep 24, 2019	Knowledge Distillation	—Unverified
Few-shot 3D LiDAR Semantic Segmentation for Autonomous Driving	Feb 17, 2023	Autonomous DrivingFew-Shot Learning	—Unverified
Few-shot Face Image Translation via GAN Prior Distillation	Jan 28, 2023	Knowledge DistillationTranslation	—Unverified
Few-shot learning of neural networks from scratch by pseudo example optimization	Feb 8, 2018	Few-Shot LearningKnowledge Distillation	—Unverified
Few-Shot Object Detection by Knowledge Distillation Using Bag-of-Visual-Words Representations	Jul 25, 2022	Few-Shot Object DetectionKnowledge Distillation	—Unverified
FGAD: Self-boosted Knowledge Distillation for An Effective Federated Graph Anomaly Detection Framework	Feb 20, 2024	Anomaly DetectionFederated Learning	—Unverified
A methodology for training homomorphicencryption friendly neural networks	Nov 5, 2021	Knowledge DistillationPrivacy Preserving	—Unverified
FiGKD: Fine-Grained Knowledge Distillation via High-Frequency Detail Transfer	May 17, 2025	Fine-Grained Visual RecognitionKnowledge Distillation	—Unverified
Fine-Grained Distillation for Long Document Retrieval	Dec 20, 2022	Knowledge DistillationRetrieval	—Unverified
Fine-grained Image Retrieval via Dual-Vision Adaptation	Jun 19, 2025	Image RetrievalKnowledge Distillation	—Unverified
Fine-tune Before Structured Pruning: Towards Compact and Accurate Self-Supervised Models for Speaker Diarization	May 30, 2025	GPUKnowledge Distillation	—Unverified
Fine-tuning a Multiple Instance Learning Feature Extractor with Masked Context Modelling and Knowledge Distillation	Mar 8, 2024	Image GenerationKnowledge Distillation	—Unverified
Boosting Pruned Networks with Linear Over-parameterization	Apr 25, 2022	Knowledge Distillation	—Unverified
Fixing the Teacher-Student Knowledge Discrepancy in Distillation	Mar 31, 2021	image-classificationImage Classification	—Unverified
FLAR: A Unified Prototype Framework for Few-Sample Lifelong Active Recognition	Jan 1, 2021	Knowledge DistillationLifelong learning	—Unverified
FlyKD: Graph Knowledge Distillation on the Fly with Curriculum Learning	Mar 16, 2024	Knowledge Distillation	—Unverified

Show:10 25 50

← PrevPage 70 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified