Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–125 of 4240 papers

Title	Date	Tasks	Status	Hype
Why Knowledge Distillation Works in Generative Models: A Minimal Working Explanation	May 19, 2025	Knowledge DistillationLanguage Modeling	—Unverified	0
Uniformity First: Uniformity-aware Test-time Adaptation of Vision-language Models against Image Corruption	May 19, 2025	Knowledge DistillationTest-time Adaptation	CodeCode Available	0
LAMeTA: Intent-Aware Agentic Network Optimization via a Large AI Model-Empowered Two-Stage Approach	May 18, 2025	Deep Reinforcement LearningKnowledge Distillation	—Unverified	0
Always Clear Depth: Robust Monocular Depth Estimation under Adverse Weather	May 18, 2025	Autonomous DrivingDepth Estimation	CodeCode Available	1
SSR: Enhancing Depth Perception in Vision-Language Models via Rationale-Guided Spatial Reasoning	May 18, 2025	Knowledge DistillationSpatial Reasoning	—Unverified	0
On Membership Inference Attacks in Knowledge Distillation	May 17, 2025	Knowledge DistillationPrivacy Preserving	CodeCode Available	0
Denoising Mutual Knowledge Distillation in Bi-Directional Multiple Instance Learning	May 17, 2025	Denoisingimage-classification	—Unverified	0
FiGKD: Fine-Grained Knowledge Distillation via High-Frequency Detail Transfer	May 17, 2025	Fine-Grained Visual RecognitionKnowledge Distillation	—Unverified	0
Semantically-Aware Game Image Quality Assessment	May 16, 2025	Feature ImportanceImage Quality Assessment	—Unverified	0
Bidirectional Distillation: A Mixed-Play Framework for Multi-Agent Generalizable Behaviors	May 16, 2025	Knowledge DistillationMulti-agent Reinforcement Learning	—Unverified	0
Distilled Circuits: A Mechanistic Study of Internal Restructuring in Knowledge Distillation	May 16, 2025	Knowledge Distillation	CodeCode Available	0
Advancing Multiple Instance Learning with Continual Learning for Whole Slide Imaging	May 15, 2025	Continual LearningDiagnostic	—Unverified	0
DCSNet: A Lightweight Knowledge Distillation-Based Model with Explainable AI for Lung Cancer Diagnosis from Histopathological Images	May 14, 2025	DiagnosticKnowledge Distillation	—Unverified	0
Low-Complexity Inference in Continual Learning via Compressed Knowledge Transfer	May 13, 2025	class-incremental learningClass Incremental Learning	—Unverified	0
MoKD: Multi-Task Optimization for Knowledge Distillation	May 13, 2025	image-classificationImage Classification	—Unverified	0
Fusing Bidirectional Chains of Thought and Reward Mechanisms A Method for Enhancing Question-Answering Capabilities of Large Language Models for Chinese Intangible Cultural Heritage	May 13, 2025	Knowledge DistillationLarge Language Model	—Unverified	0
Foundation Models Knowledge Distillation For Battery Capacity Degradation Forecast	May 13, 2025	Knowledge DistillationTime Series	CodeCode Available	1
An Extra RMSNorm is All You Need for Fine Tuning to 1.58 Bits	May 12, 2025	AllKnowledge Distillation	—Unverified	0
KDH-MLTC: Knowledge Distillation for Healthcare Multi-Label Text Classification	May 12, 2025	ClassificationHyperparameter Optimization	—Unverified	0
Channel Fingerprint Construction for Massive MIMO: A Deep Conditional Generative Approach	May 12, 2025	DenoisingKnowledge Distillation	—Unverified	0
Topology-Guided Knowledge Distillation for Efficient Point Cloud Processing	May 12, 2025	3D Object RecognitionAutonomous Driving	CodeCode Available	0
Simple Semi-supervised Knowledge Distillation from Vision-Language Models via Dual-Head Optimization	May 12, 2025	Few-Shot Image ClassificationKnowledge Distillation	CodeCode Available	0
Ranking-aware Continual Learning for LiDAR Place Recognition	May 12, 2025	Autonomous DrivingContinual Learning	—Unverified	0
Structural Entropy Guided Agent for Detecting and Repairing Knowledge Deficiencies in LLMs	May 12, 2025	AI AgentKnowledge Distillation	CodeCode Available	2
Knowledge Distillation for Enhancing Walmart E-commerce Search Relevance Using Large Language Models	May 11, 2025	Knowledge Distillation	—Unverified	0

Show:10 25 50

← PrevPage 5 of 170Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified