Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3551–3600 of 4240 papers

Title	Date	Tasks	Status
SIKeD: Self-guided Iterative Knowledge Distillation for mathematical reasoning	Oct 24, 2024	Knowledge DistillationMathematical Reasoning	CodeCode Available
Unlearning Backdoor Attacks for LLMs with Weak-to-Strong Knowledge Distillation	Oct 18, 2024	Backdoor AttackKnowledge Distillation	CodeCode Available
Less-supervised learning with knowledge distillation for sperm morphology analysis	May 8, 2024	Anomaly DetectionKnowledge Distillation	CodeCode Available
Knowledge Distillation Performs Partial Variance Reduction	May 27, 2023	Knowledge Distillation	CodeCode Available
Better Teacher Better Student: Dynamic Prior Knowledge for Knowledge Distillation	Jun 13, 2022	image-classificationImage Classification	CodeCode Available
Applying Knowledge Distillation to Improve Weed Mapping With Drones	Oct 8, 2023	Knowledge DistillationManagement	CodeCode Available
Simon Says: Evaluating and Mitigating Bias in Pruned Neural Networks with Knowledge Distillation	Jun 15, 2021	FairnessKnowledge Distillation	CodeCode Available
DynaMMo: Dynamic Model Merging for Efficient Class Incremental Learning for Medical Images	Apr 22, 2024	class-incremental learningClass Incremental Learning	CodeCode Available
Continual Contrastive Learning for Image Classification	Jul 5, 2021	ClassificationContinual Learning	CodeCode Available
Dynamic Sub-graph Distillation for Robust Semi-supervised Continual Learning	Dec 27, 2023	Continual Learninggraph construction	CodeCode Available
Dynamic Rectification Knowledge Distillation	Jan 27, 2022	Edge-computingKnowledge Distillation	CodeCode Available
DVFL-Net: A Lightweight Distilled Video Focal Modulation Network for Spatio-Temporal Action Recognition	Jul 16, 2025	BenchmarkingKnowledge Distillation	CodeCode Available
Projected Latent Distillation for Data-Agnostic Consolidation in Distributed Continual Learning	Mar 28, 2023	Continual LearningKnowledge Distillation	CodeCode Available
Leveraging Diffusion-Based Image Variations for Robust Training on Poisoned Data	Oct 10, 2023	Knowledge Distillation	CodeCode Available
An Unsupervised Multiple-Task and Multiple-Teacher Model for Cross-lingual Named Entity Recognition	Nov 16, 2021	Cross-Lingual NERKnowledge Distillation	CodeCode Available
Simple Semi-supervised Knowledge Distillation from Vision-Language Models via Dual-Head Optimization	May 12, 2025	Few-Shot Image ClassificationKnowledge Distillation	CodeCode Available
A Comprehensive Overhaul of Feature Distillation	Apr 3, 2019	General Classificationimage-classification	CodeCode Available
Leveraging Foundation Models via Knowledge Distillation in Multi-Object Tracking: Distilling DINOv2 Features to FairMOT	Jul 25, 2024	Knowledge DistillationMulti-Object Tracking	CodeCode Available
Leveraging Knowledge Distillation for Efficient Deep Reinforcement Learning in Resource-Constrained Environments	Oct 16, 2023	Decision MakingDeep Reinforcement Learning	CodeCode Available
Promoting Generalized Cross-lingual Question Answering in Few-resource Scenarios via Self-knowledge Distillation	Sep 29, 2023	Cross-Lingual Question AnsweringCross-Lingual Transfer	CodeCode Available
Leveraging knowledge distillation for partial multi-task learning from multiple remote sensing datasets	May 24, 2024	Knowledge DistillationMulti-Task Learning	CodeCode Available
Leveraging Large Language Models for Active Merchant Non-player Characters	Dec 15, 2024	Knowledge Distillation	CodeCode Available
TextKD-GAN: Text Generation using KnowledgeDistillation and Generative Adversarial Networks	Apr 23, 2019	Image GenerationKnowledge Distillation	CodeCode Available
Continual Coarse-to-Fine Domain Adaptation in Semantic Segmentation	Jan 18, 2022	Domain AdaptationKnowledge Distillation	CodeCode Available
Leveraging Topological Guidance for Improved Knowledge Distillation	Jul 7, 2024	image-classificationImage Classification	CodeCode Available
Dual Correction Strategy for Ranking Distillation in Top-N Recommender System	Sep 8, 2021	Knowledge DistillationRecommendation Systems	CodeCode Available
Knowledge Distillation of Russian Language Models with Reduction of Vocabulary	May 4, 2022	Knowledge Distillation	CodeCode Available
Knowledge Distillation Layer that Lets the Student Decide	Sep 6, 2023	Knowledge Distillation	CodeCode Available
DSMix: Distortion-Induced Sensitivity Map Based Pre-training for No-Reference Image Quality Assessment	Jul 4, 2024	Data AugmentationImage Quality Assessment	CodeCode Available
DSG-KD: Knowledge Distillation from Domain-Specific to General Language Models	Sep 23, 2024	Knowledge DistillationTransfer Learning	CodeCode Available
Better Supervisory Signals by Observing Learning Paths	Mar 4, 2022	Knowledge Distillation	CodeCode Available
Knowledge Distillation in RNN-Attention Models for Early Prediction of Student Performance	Dec 19, 2024	Knowledge DistillationStudent dropout	CodeCode Available
DS_FusionNet: Dynamic Dual-Stream Fusion with Bidirectional Knowledge Distillation for Plant Disease Recognition	Apr 29, 2025	Fine-Grained Image Classificationimage-classification	CodeCode Available
DROP: Poison Dilution via Knowledge Distillation for Federated Learning	Feb 10, 2025	Data PoisoningFederated Learning	CodeCode Available
Prototype-guided Cross-task Knowledge Distillation for Large-scale Models	Dec 26, 2022	Knowledge Distillation	CodeCode Available
Do You Remember . . . the Future? Weak-to-Strong generalization in 3D Object Detection	Aug 3, 2024	3D Object DetectionKnowledge Distillation	CodeCode Available
Context Unaware Knowledge Distillation for Image Retrieval	Jul 19, 2022	Image RetrievalKnowledge Distillation	CodeCode Available
Proxy-Anchor and EVT-Driven Continual Learning Method for Generalized Category Discovery	Apr 11, 2025	Continual LearningKnowledge Distillation	CodeCode Available
BEiT v2: Masked Image Modeling with Vector-Quantized Visual Tokenizers	Aug 12, 2022	image-classificationImage Classification	CodeCode Available
Knowledge Distillation from Single to Multi Labels: an Empirical Study	Mar 15, 2023	Classificationimage-classification	CodeCode Available
PrUE: Distilling Knowledge from Sparse Teacher Networks	Jul 3, 2022	Knowledge Distillation	CodeCode Available
Domain-Lifelong Learning for Dialogue State Tracking via Knowledge Preservation Networks	Nov 1, 2021	Dialogue State TrackingDiversity	CodeCode Available
Few Sample Knowledge Distillation for Efficient Network Compression	Dec 5, 2018	Knowledge DistillationNetwork Pruning	CodeCode Available
Knowledge Distillation from Cross Teaching Teachers for Efficient Semi-Supervised Abdominal Organ Segmentation in CT	Nov 11, 2022	Image SegmentationKnowledge Distillation	CodeCode Available
Knowledge Distillation For Wireless Edge Learning	Apr 3, 2021	Cloud ComputingFederated Learning	CodeCode Available
Light Multi-segment Activation for Model Compression	Jul 16, 2019	Knowledge Distillationmodel	CodeCode Available
Lightning Fast Video Anomaly Detection via Adversarial Knowledge Distillation	Nov 28, 2022	Anomaly DetectionKnowledge Distillation	CodeCode Available
Domain Knowledge Transferring for Pre-trained Language Model via Calibrated Activation Boundary Distillation	May 1, 2022	Knowledge DistillationLanguage Modeling	CodeCode Available
LightPath: Lightweight and Scalable Path Representation Learning	Jul 19, 2023	Knowledge DistillationRelational Reasoning	CodeCode Available
Domain Generalization for Crop Segmentation with Standardized Ensemble Knowledge Distillation	Apr 3, 2023	Domain GeneralizationKnowledge Distillation	CodeCode Available

Show:10 25 50

← PrevPage 72 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified