Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2001–2050 of 4240 papers

Title	Date	Tasks	Status	Hype
An Empirical Study of Leveraging Knowledge Distillation for Compressing Multilingual Neural Machine Translation Models	Apr 19, 2023	Knowledge DistillationMachine Translation	—Unverified	0
Biologically inspired structure learning with reverse knowledge distillation for spiking neural networks	Apr 19, 2023	Knowledge Distillation	—Unverified	0
Deep Collective Knowledge Distillation	Apr 18, 2023	Knowledge DistillationModel Compression	—Unverified	0
LaSNN: Layer-wise ANN-to-SNN Distillation for Effective and Efficient Training in Deep Spiking Neural Networks	Apr 17, 2023	Knowledge Distillation	—Unverified	0
Always Strengthen Your Strengths: A Drift-Aware Incremental Learning Framework for CTR Prediction	Apr 17, 2023	Click-Through Rate PredictionDiversity	—Unverified	0
OVTrack: Open-Vocabulary Multiple Object Tracking	Apr 17, 2023	DenoisingHallucination	CodeCode Available	1
Learning to "Segment Anything" in Thermal Infrared Images through Knowledge Distillation with a Large Scale Dataset SATIR	Apr 17, 2023	Image SegmentationKnowledge Distillation	CodeCode Available	0
Robust Cross-Modal Knowledge Distillation for Unconstrained Videos	Apr 16, 2023	Action RecognitionAudio Tagging	CodeCode Available	1
Teacher Network Calibration Improves Cross-Quality Knowledge Distillation	Apr 15, 2023	image-classificationImage Classification	CodeCode Available	0
Learn What Is Possible, Then Choose What Is Best: Disentangling One-To-Many Relations in Language Through Text-based Games	Apr 14, 2023	Knowledge Distillationtext-based games	CodeCode Available	0
Multi-Mode Online Knowledge Distillation for Self-Supervised Visual Representation Learning	Apr 13, 2023	Knowledge DistillationRepresentation Learning	CodeCode Available	1
Class-Incremental Learning of Plant and Disease Detection: Growing Branches with Knowledge Distillation	Apr 13, 2023	class-incremental learningClass Incremental Learning	—Unverified	0
Constructing Deep Spiking Neural Networks from Artificial Neural Networks with Knowledge Distillation	Apr 12, 2023	Knowledge Distillation	—Unverified	0
SFT-KD-Recon: Learning a Student-friendly Teacher for Knowledge Distillation in Magnetic Resonance Image Reconstruction	Apr 11, 2023	Image ReconstructionKnowledge Distillation	CodeCode Available	0
Grouped Knowledge Distillation for Deep Face Recognition	Apr 10, 2023	Face RecognitionKnowledge Distillation	—Unverified	0
A Survey on Recent Teacher-student Learning Studies	Apr 10, 2023	Knowledge DistillationSurvey	—Unverified	0
HyperINR: A Fast and Predictive Hypernetwork for Implicit Neural Representations via Knowledge Distillation	Apr 9, 2023	Knowledge DistillationNovel View Synthesis	—Unverified	0
Homogenizing Non-IID datasets via In-Distribution Knowledge Distillation for Decentralized Learning	Apr 9, 2023	image-classificationImage Classification	—Unverified	0
A Comprehensive Survey on Knowledge Distillation of Diffusion Models	Apr 9, 2023	Knowledge DistillationSurvey	—Unverified	0
Model-Agnostic Decentralized Collaborative Learning for On-Device POI Recommendation	Apr 8, 2023	Knowledge DistillationPrivacy Preserving	—Unverified	0
Continual Learning for LiDAR Semantic Segmentation: Class-Incremental and Coarse-to-Fine strategies on Sparse Data	Apr 8, 2023	class-incremental learningClass Incremental Learning	CodeCode Available	1
Masked Student Dataset of Expressions	Apr 7, 2023	Contrastive LearningFacial Expression Recognition	CodeCode Available	0
Continual Detection Transformer for Incremental Object Detection	Apr 6, 2023	Class-Incremental Object DetectionKnowledge Distillation	—Unverified	0
DiGA: Distil to Generalize and then Adapt for Domain Adaptive Semantic Segmentation	Apr 5, 2023	Data AugmentationKnowledge Distillation	CodeCode Available	1
Towards Efficient Task-Driven Model Reprogramming with Foundation Models	Apr 5, 2023	Knowledge DistillationTransfer Learning	—Unverified	0
Self-Distillation for Gaussian Process Regression and Classification	Apr 5, 2023	ClassificationGPR	CodeCode Available	0
MadEye: Boosting Live Video Analytics Accuracy with Adaptive Camera Configurations	Apr 4, 2023	Knowledge Distillation	—Unverified	0
Selective Knowledge Sharing for Privacy-Preserving Federated Distillation without A Good Teacher	Apr 4, 2023	Federated LearningKnowledge Distillation	CodeCode Available	1
Cross-Class Feature Augmentation for Class Incremental Learning	Apr 4, 2023	class-incremental learningClass Incremental Learning	—Unverified	0
Knowledge-Distilled Graph Neural Networks for Personalized Epileptic Seizure Detection	Apr 3, 2023	channel selectionEEG	—Unverified	0
Vision-Language Models for Vision Tasks: A Survey	Apr 3, 2023	BenchmarkingKnowledge Distillation	CodeCode Available	4
Domain Generalization for Crop Segmentation with Standardized Ensemble Knowledge Distillation	Apr 3, 2023	Domain GeneralizationKnowledge Distillation	CodeCode Available	0
A Unified Compression Framework for Efficient Speech-Driven Talking-Face Generation	Apr 2, 2023	Face GenerationKnowledge Distillation	—Unverified	0
Selective Knowledge Distillation for Non-Autoregressive Neural Machine Translation	Mar 31, 2023	Knowledge DistillationMachine Translation	—Unverified	0
Quick Dense Retrievers Consume KALE: Post Training Kullback Leibler Alignment of Embeddings for Asymmetrical dual encoders	Mar 31, 2023	Knowledge DistillationLanguage Modeling	—Unverified	0
GVP: Generative Volumetric Primitives	Mar 31, 2023	Image GenerationKnowledge Distillation	—Unverified	0
Knowledge Distillation for Feature Extraction in Underwater VSLAM	Mar 31, 2023	BinarizationKnowledge Distillation	CodeCode Available	1
oBERTa: Improving Sparse Transfer Learning via improved initialization, distillation, and pruning regimes	Mar 30, 2023	Knowledge DistillationModel Compression	—Unverified	0
If At First You Don't Succeed: Test Time Re-ranking for Zero-shot, Cross-domain Retrieval	Mar 30, 2023	Image RetrievalKnowledge Distillation	—Unverified	0
Kaizen: Practical Self-supervised Continual Learning with Continual Fine-tuning	Mar 30, 2023	Continual LearningKnowledge Distillation	CodeCode Available	1
KD-DLGAN: Data Limited Image Generation via Knowledge Distillation	Mar 30, 2023	DiversityImage Generation	—Unverified	0
Asymmetric Image Retrieval with Cross Model Compatible Ensembles	Mar 30, 2023	DiversityFace Recognition	—Unverified	0
SimDistill: Simulated Multi-modal Distillation for BEV 3D Object Detection	Mar 29, 2023	3D geometry3D Object Detection	CodeCode Available	1
Dice Semimetric Losses: Optimizing the Dice Score with Soft Labels	Mar 28, 2023	Knowledge Distillation	CodeCode Available	1
Information-Theoretic GAN Compression with Variational Energy-based Model	Mar 28, 2023	Image EnhancementKnowledge Distillation	—Unverified	0
HOICLIP: Efficient Knowledge Transfer for HOI Detection with Vision-Language Models	Mar 28, 2023	DecoderHuman-Object Interaction Detection	CodeCode Available	1
SELF-VS: Self-supervised Encoding Learning For Video Summarization	Mar 28, 2023	Knowledge DistillationRepresentation Learning	CodeCode Available	0
Projected Latent Distillation for Data-Agnostic Consolidation in Distributed Continual Learning	Mar 28, 2023	Continual LearningKnowledge Distillation	CodeCode Available	0
DisWOT: Student Architecture Search for Distillation WithOut Training	Mar 28, 2023	Knowledge Distillation	CodeCode Available	1
Improving Neural Topic Models with Wasserstein Knowledge Distillation	Mar 27, 2023	Knowledge DistillationTopic Models	CodeCode Available	0

Show:10 25 50

← PrevPage 41 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified