Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4001–4050 of 4240 papers

Title	Date	Tasks	Status
SalNAS: Efficient Saliency-prediction Neural Architecture Search with self-knowledge distillation	Jul 29, 2024	DecoderKnowledge Distillation	CodeCode Available
Deep geometric knowledge distillation with graphs	Nov 8, 2019	Knowledge Distillation	CodeCode Available
Class incremental learning with probability dampening and cascaded gated classifier	Feb 2, 2024	class-incremental learningClass Incremental Learning	CodeCode Available
NutePrune: Efficient Progressive Pruning with Numerous Teachers for Large Language Models	Feb 15, 2024	Knowledge Distillation	CodeCode Available
Attentive Task Interaction Network for Multi-Task Learning	Jan 25, 2022	DecoderKnowledge Distillation	CodeCode Available
CaPriDe Learning: Confidential and Private Decentralized Learning Based on Encryption-Friendly Distillation Loss	Jan 1, 2023	Federated LearningKnowledge Distillation	CodeCode Available
SA-MLP: Distilling Graph Knowledge from GNNs into Structure-Aware MLP	Oct 18, 2022	Knowledge DistillationNode Classification	CodeCode Available
Deep-Disaster: Unsupervised Disaster Detection and Localization Using Visual Data	Jan 31, 2022	HumanitarianKnowledge Distillation	CodeCode Available
FedSDAF: Leveraging Source Domain Awareness for Enhanced Federated Domain Generalization	May 5, 2025	Domain GeneralizationKnowledge Distillation	CodeCode Available
Enhancing OOD Detection Using Latent Diffusion	Jun 24, 2024	Contrastive LearningKnowledge Distillation	CodeCode Available
3M-Health: Multimodal Multi-Teacher Knowledge Distillation for Mental Health Detection	Jul 12, 2024	Knowledge DistillationSocial Media Mental Health Detection	CodeCode Available
Object Attribute Matters in Visual Question Answering	Dec 20, 2023	AttributeGraph Neural Network	CodeCode Available
Advancing Compressed Video Action Recognition through Progressive Knowledge Distillation	Jul 2, 2024	Action RecognitionKnowledge Distillation	CodeCode Available
Towards Enabling Meta-Learning from Target Models	Apr 8, 2021	Few-Shot LearningInductive Bias	CodeCode Available
Fed-RAC: Resource-Aware Clustering for Tackling Heterogeneity of Participants in Federated Learning	Mar 20, 2024	ClusteringFederated Learning	CodeCode Available
FedKD-hybrid: Federated Hybrid Knowledge Distillation for Lithography Hotspot Detection	Jan 7, 2025	Federated LearningKnowledge Distillation	CodeCode Available
Deep Clustering with Diffused Sampling and Hardness-aware Self-distillation	Jan 25, 2024	ClusteringContrastive Learning	CodeCode Available
CAPEEN: Image Captioning with Early Exits and Knowledge Distillation	Oct 6, 2024	DescriptiveImage Captioning	CodeCode Available
ODM3D: Alleviating Foreground Sparsity for Semi-Supervised Monocular 3D Object Detection	Oct 28, 2023	3D Object DetectionAutonomous Driving	CodeCode Available
Scaffolding a Student to Instill Knowledge	May 1, 2023	Knowledge Distillation	CodeCode Available
Scalable Attentive Sentence-Pair Modeling via Distilled Sentence Embedding	Aug 14, 2019	Knowledge DistillationNatural Language Understanding	CodeCode Available
Okay, Let's Do This! Modeling Event Coreference with Generated Rationales and Knowledge Distillation	Apr 4, 2024	Clusteringcoreference-resolution	CodeCode Available
VarGFaceNet: An Efficient Variable Group Convolutional Neural Network for Lightweight Face Recognition	Oct 11, 2019	Face DetectionFace Identification	CodeCode Available
Understanding and Improving Knowledge Distillation for Quantization-Aware Training of Large Transformer Encoders	Nov 20, 2022	Knowledge DistillationModel Compression	CodeCode Available
Swapped Logit Distillation via Bi-level Teacher Alignment	Apr 27, 2025	image-classificationImage Classification	CodeCode Available
Scale-Aware Contrastive Reverse Distillation for Unsupervised Medical Anomaly Detection	Mar 18, 2025	Anomaly DetectionKnowledge Distillation	CodeCode Available
Deep Class Incremental Learning from Decentralized Data	Mar 11, 2022	class-incremental learningClass Incremental Learning	CodeCode Available
FedICT: Federated Multi-task Distillation for Multi-access Edge Computing	Jan 1, 2023	Edge-computingFederated Learning	CodeCode Available
On-Device Language Models: A Comprehensive Review	Aug 26, 2024	Knowledge DistillationQuantization	CodeCode Available
FedHPD: Heterogeneous Federated Reinforcement Learning via Policy Distillation	Feb 2, 2025	Knowledge Distillationreinforcement-learning	CodeCode Available
Deep Classifier Mimicry without Data Access	Jun 3, 2023	Knowledge Distillation	CodeCode Available
Attention to detail: inter-resolution knowledge distillation	Jan 11, 2024	Knowledge Distillationwhole slide images	CodeCode Available
Can Self-Supervised Representation Learning Methods Withstand Distribution Shifts and Corruptions?	Jul 31, 2023	Contrastive LearningKnowledge Distillation	CodeCode Available
DED: Diagnostic Evidence Distillation for acne severity grading on face images	Oct 5, 2023	Acne Severity GradingDiagnostic	CodeCode Available
FedHe: Heterogeneous Models and Communication-Efficient Federated Learning	Oct 19, 2021	Federated LearningKnowledge Distillation	CodeCode Available
Adaptive Decoupled Pose Knowledge Distillation	Oct 1, 2023	Knowledge DistillationPose Estimation	CodeCode Available
Decoupled Knowledge with Ensemble Learning for Online Distillation	Dec 18, 2023	Ensemble LearningKnowledge Distillation	CodeCode Available
On enhancing the robustness of Vision Transformers: Defensive Diffusion	May 14, 2023	Computational EfficiencyDenoising	CodeCode Available
One Reference Is Not Enough: Diverse Distillation with Reference Selection for Non-Autoregressive Translation	May 28, 2022	Knowledge DistillationMachine Translation	CodeCode Available
Camera-Incremental Object Re-Identification with Identity Knowledge Evolution	May 25, 2023	Knowledge DistillationObject	CodeCode Available
Federated Learning for Time-Series Healthcare Sensing with Incomplete Modalities	May 20, 2024	Computational EfficiencyFederated Learning	CodeCode Available
One-shot Federated Learning without Server-side Training	Apr 26, 2022	Federated Learningimage-classification	CodeCode Available
Federated Learning with a Single Shared Image	Jun 18, 2024	Federated LearningKnowledge Distillation	CodeCode Available
Federated Incremental Named Entity Recognition	Nov 18, 2024	Knowledge Distillationnamed-entity-recognition	CodeCode Available
FedDW: Distilling Weights through Consistency Optimization in Heterogeneous Federated Learning	Dec 5, 2024	Federated LearningKnowledge Distillation	CodeCode Available
CADIS: Handling Cluster-skewed Non-IID Data in Federated Learning with Clustered Aggregation and Knowledge DIStilled Regularization	Feb 21, 2023	Federated LearningKnowledge Distillation	CodeCode Available
Symmetrical Bidirectional Knowledge Alignment for Zero-Shot Sketch-Based Image Retrieval	Dec 16, 2023	Image RetrievalKnowledge Distillation	CodeCode Available
Synchronization is All You Need: Exocentric-to-Egocentric Transfer for Temporal Action Segmentation with Unlabeled Synchronized Video Pairs	Dec 5, 2023	Action SegmentationAll	CodeCode Available
One-Teacher and Multiple-Student Knowledge Distillation on Sentiment Classification	Oct 1, 2022	Ensemble LearningKnowledge Distillation	CodeCode Available
Decoding visual brain representations from electroencephalography through Knowledge Distillation and latent diffusion models	Sep 8, 2023	Brain DecodingEEG	CodeCode Available

Show:10 25 50

← PrevPage 81 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified