Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 251–300 of 4240 papers

Title	Date	Tasks	Status	Hype
MMIDR: Teaching Large Language Model to Interpret Multimodal Misinformation via Knowledge Distillation	Mar 21, 2024	Data AugmentationDecision Making	CodeCode Available	1
Instruction Multi-Constraint Molecular Generation Using a Teacher-Student Large Language Model	Mar 20, 2024	Drug DiscoveryKnowledge Distillation	CodeCode Available	1
Self-Supervised Quantization-Aware Knowledge Distillation	Mar 17, 2024	Knowledge DistillationQuantization	CodeCode Available	1
Histo-Genomic Knowledge Distillation For Cancer Prognosis From Histopathology Whole Slide Images	Mar 15, 2024	BenchmarkingKnowledge Distillation	CodeCode Available	1
SpikeReveal: Unlocking Temporal Sequences from Real Blurry Inputs with Spike Streams	Mar 14, 2024	DeblurringKnowledge Distillation	CodeCode Available	1
Continual All-in-One Adverse Weather Removal with Knowledge Replay on a Unified Network Structure	Mar 12, 2024	AllContinual Learning	CodeCode Available	1
eDifFIQA: Towards Efficient Face Image Quality Assessment Based On Denoising Diffusion Probabilistic Models	Mar 12, 2024	DenoisingFace Image Quality	CodeCode Available	1
Bit-mask Robust Contrastive Knowledge Distillation for Unsupervised Semantic Hashing	Mar 10, 2024	Image RetrievalKnowledge Distillation	CodeCode Available	1
Frequency Attention for Knowledge Distillation	Mar 9, 2024	image-classificationImage Classification	CodeCode Available	1
RadarDistill: Boosting Radar-based Object Detection Performance via Knowledge Distillation from LiDAR Features	Mar 8, 2024	3D Object DetectionKnowledge Distillation	CodeCode Available	1
Self-Adapting Large Visual-Language Models to Edge Devices across Visual Modalities	Mar 7, 2024	Contrastive LearningKnowledge Distillation	CodeCode Available	1
Sunshine to Rainstorm: Cross-Weather Knowledge Distillation for Robust 3D Object Detection	Feb 28, 2024	3D Object DetectionKnowledge Distillation	CodeCode Available	1
PromptKD: Distilling Student-Friendly Knowledge for Generative Language Models via Prompt Tuning	Feb 20, 2024	Instruction FollowingKnowledge Distillation	CodeCode Available	1
Improve Cross-Architecture Generalization on Dataset Distillation	Feb 20, 2024	Dataset DistillationKnowledge Distillation	CodeCode Available	1
Knowledge Distillation Based on Transformed Teacher Matching	Feb 17, 2024	Knowledge Distillation	CodeCode Available	1
GraphKD: Exploring Knowledge Distillation Towards Document Object Detection with Structured Graph Creation	Feb 17, 2024	Knowledge Distillationobject-detection	CodeCode Available	1
LaCo: Large Language Model Pruning via Layer Collapse	Feb 17, 2024	Knowledge DistillationLanguage Modeling	CodeCode Available	1
Training Heterogeneous Client Models using Knowledge Distillation in Serverless Federated Learning	Feb 11, 2024	Federated LearningKnowledge Distillation	CodeCode Available	1
Vision Superalignment: Weak-to-Strong Generalization for Vision Foundation Models	Feb 6, 2024	Few-Shot LearningKnowledge Distillation	CodeCode Available	1
Good Teachers Explain: Explanation-Enhanced Knowledge Distillation	Feb 5, 2024	Knowledge Distillation	CodeCode Available	1
BGE M3-Embedding: Multi-Lingual, Multi-Functionality, Multi-Granularity Text Embeddings Through Self-Knowledge Distillation	Feb 5, 2024	Knowledge DistillationRetrieval	CodeCode Available	1
Large Language Model Distilling Medication Recommendation Model	Feb 5, 2024	Knowledge DistillationLanguage Modeling	CodeCode Available	1
LQER: Low-Rank Quantization Error Reconstruction for LLMs	Feb 4, 2024	Knowledge DistillationQuantization	CodeCode Available	1
Communication-Efficient Federated Learning through Adaptive Weight Clustering and Server-Side Distillation	Jan 25, 2024	ClusteringFederated Learning	CodeCode Available	1
Rethinking Centered Kernel Alignment in Knowledge Distillation	Jan 22, 2024	image-classificationImage Classification	CodeCode Available	1
HiCD: Change Detection in Quality-Varied Images via Hierarchical Correlation Distillation	Jan 19, 2024	Change DetectionKnowledge Distillation	CodeCode Available	1
TelME: Teacher-leading Multimodal Fusion Network for Emotion Recognition in Conversation	Jan 16, 2024	Emotion RecognitionEmotion Recognition in Conversation	CodeCode Available	1
Bayes Conditional Distribution Estimation for Knowledge Distillation Based on Conditional Mutual Information	Jan 16, 2024	Knowledge Distillation	CodeCode Available	1
Graph Relation Distillation for Efficient Biomedical Instance Segmentation	Jan 12, 2024	Instance SegmentationKnowledge Distillation	CodeCode Available	1
HAAQI-Net: A Non-intrusive Neural Music Audio Quality Assessment Model for Hearing Aids	Jan 2, 2024	Audio Quality AssessmentAudio Signal Processing	CodeCode Available	1
Distribution-aware Knowledge Prototyping for Non-exemplar Lifelong Person Re-identification	Jan 1, 2024	DiversityKnowledge Distillation	CodeCode Available	1
FCS: Feature Calibration and Separation for Non-Exemplar Class Incremental Learning	Jan 1, 2024	class-incremental learningClass Incremental Learning	CodeCode Available	1
DIOD: Self-Distillation Meets Object Discovery	Jan 1, 2024	Instance SegmentationKnowledge Distillation	CodeCode Available	1
CaKDP: Category-aware Knowledge Distillation and Pruning Framework for Lightweight 3D Object Detection	Jan 1, 2024	3D Object DetectionKnowledge Distillation	CodeCode Available	1
FerKD: Surgical Label Adaptation for Efficient Distillation	Dec 29, 2023	Knowledge Distillation	CodeCode Available	1
Federated Learning with Extremely Noisy Clients via Negative Distillation	Dec 20, 2023	Federated LearningKnowledge Distillation	CodeCode Available	1
Distilling Autoregressive Models to Obtain High-Performance Non-Autoregressive Solvers for Vehicle Routing Problems with Faster Inference Speed	Dec 19, 2023	Knowledge Distillation	CodeCode Available	1
DistilVPR: Cross-Modal Knowledge Distillation for Visual Place Recognition	Dec 17, 2023	Knowledge DistillationVisual Place Recognition	CodeCode Available	1
Your Student is Better Than Expected: Adaptive Teacher-Student Collaboration for Text-Conditional Diffusion Models	Dec 17, 2023	Image GenerationKnowledge Distillation	CodeCode Available	1
Simple Image-level Classification Improves Open-vocabulary Object Detection	Dec 16, 2023	Knowledge DistillationObject	CodeCode Available	1
Generative Model-based Feature Knowledge Distillation for Action Recognition	Dec 14, 2023	Action DetectionAction Recognition	CodeCode Available	1
CLIP-guided Federated Learning on Heterogeneous and Long-Tailed Data	Dec 14, 2023	Contrastive LearningFederated Learning	CodeCode Available	1
SKDF: A Simple Knowledge Distillation Framework for Distilling Open-Vocabulary Knowledge to Open-world Object Detector	Dec 14, 2023	Knowledge DistillationObject	CodeCode Available	1
KDAS: Knowledge Distillation via Attention Supervision Framework for Polyp Segmentation	Dec 13, 2023	Knowledge DistillationMedical Image Segmentation	CodeCode Available	1
Traffic Signal Control Using Lightweight Transformers: An Offline-to-Online RL Approach	Dec 12, 2023	Knowledge DistillationOffline RL	CodeCode Available	1
Augmentation-Free Dense Contrastive Knowledge Distillation for Efficient Semantic Segmentation	Dec 7, 2023	Contrastive LearningData Augmentation	CodeCode Available	1
Enhancing and Adapting in the Clinic: Source-free Unsupervised Domain Adaptation for Medical Image Enhancement	Dec 3, 2023	Domain AdaptationImage Enhancement	CodeCode Available	1
Dual-Teacher De-biasing Distillation Framework for Multi-domain Fake News Detection	Dec 2, 2023	Fake News DetectionKnowledge Distillation	CodeCode Available	1
Initializing Models with Larger Ones	Nov 30, 2023	Knowledge Distillation	CodeCode Available	1
Continual Learning for Image Segmentation with Dynamic Query	Nov 29, 2023	Continual LearningDiversity	CodeCode Available	1

Show:10 25 50

← PrevPage 6 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified