Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1351–1400 of 4240 papers

Title	Date	Tasks	Status	Hype
Deep Clustering with Diffused Sampling and Hardness-aware Self-distillation	Jan 25, 2024	ClusteringContrastive Learning	CodeCode Available	0
Communication-Efficient Federated Learning through Adaptive Weight Clustering and Server-Side Distillation	Jan 25, 2024	ClusteringFederated Learning	CodeCode Available	1
Self-supervised Video Object Segmentation with Distillation Learning of Deformable Attention	Jan 25, 2024	Knowledge DistillationObject	—Unverified	0
Towards Complementary Knowledge Distillation for Efficient Dense Image Prediction	Jan 24, 2024	Implicit RelationsInstance Segmentation	—Unverified	0
Contrastive Learning in Distilled Models	Jan 23, 2024	Contrastive LearningKnowledge Distillation	CodeCode Available	0
Knowledge Distillation from Language-Oriented to Emergent Communication for Multi-Agent Remote Control	Jan 23, 2024	Deep Reinforcement LearningKnowledge Distillation	—Unverified	0
A Novel Garment Transfer Method Supervised by Distilled Knowledge of Virtual Try-on Model	Jan 23, 2024	DisentanglementKnowledge Distillation	—Unverified	0
Stereo-Matching Knowledge Distilled Monocular Depth Estimation Filtered by Multiple Disparity Consistency	Jan 22, 2024	Depth EstimationKnowledge Distillation	—Unverified	0
Knowledge Distillation on Spatial-Temporal Graph Convolutional Network for Traffic Prediction	Jan 22, 2024	Graph Neural NetworkKnowledge Distillation	—Unverified	0
Robustness to distribution shifts of compressed networks for edge devices	Jan 22, 2024	Knowledge DistillationQuantization	—Unverified	0
Rethinking Centered Kernel Alignment in Knowledge Distillation	Jan 22, 2024	image-classificationImage Classification	CodeCode Available	1
Zoom-shot: Fast and Efficient Unsupervised Zero-Shot Transfer of CLIP to Vision Encoders with Multimodal Loss	Jan 22, 2024	Knowledge Distillationzero-shot-classification	—Unverified	0
Keep Decoding Parallel with Effective Knowledge Distillation from Language Models to End-to-end Speech Recognisers	Jan 22, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Confidence Preservation Property in Knowledge Distillation Abstractions	Jan 21, 2024	ClassificationKnowledge Distillation	—Unverified	0
HiCD: Change Detection in Quality-Varied Images via Hierarchical Correlation Distillation	Jan 19, 2024	Change DetectionKnowledge Distillation	CodeCode Available	1
Enhancing Scalability in Recommender Systems through Lottery Ticket Hypothesis and Knowledge Distillation-based Neural Network Pruning	Jan 19, 2024	GPUKnowledge Distillation	—Unverified	0
Large Language Models are Efficient Learners of Noise-Robust Speech Recognition	Jan 19, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	2
Model Compression Techniques in Biometrics Applications: A Survey	Jan 18, 2024	FairnessKnowledge Distillation	CodeCode Available	0
TelME: Teacher-leading Multimodal Fusion Network for Emotion Recognition in Conversation	Jan 16, 2024	Emotion RecognitionEmotion Recognition in Conversation	CodeCode Available	1
Bayes Conditional Distribution Estimation for Knowledge Distillation Based on Conditional Mutual Information	Jan 16, 2024	Knowledge Distillation	CodeCode Available	1
Cross-Level Multi-Instance Distillation for Self-Supervised Fine-Grained Visual Categorization	Jan 16, 2024	Fine-Grained Visual CategorizationKnowledge Distillation	—Unverified	0
OBSeg: Accurate and Fast Instance Segmentation Framework Using Segmentation Foundation Models with Oriented Bounding Box Prompts	Jan 16, 2024	Amodal Instance SegmentationInstance Segmentation	CodeCode Available	2
Generative Denoise Distillation: Simple Stochastic Noises Induce Efficient Knowledge Transfer for Dense Prediction	Jan 16, 2024	Instance SegmentationKnowledge Distillation	CodeCode Available	0
A Deep Hierarchical Feature Sparse Framework for Occluded Person Re-Identification	Jan 15, 2024	Data AugmentationKnowledge Distillation	—Unverified	0
Lightweight Modality Adaptation to Sequential Recommendation via Correlation Supervision	Jan 14, 2024	Knowledge DistillationRepresentation Learning	—Unverified	0
Knowledge Distillation of Black-Box Large Language Models	Jan 13, 2024	Knowledge DistillationTransfer Learning	—Unverified	0
EVOKE: Emotion Enabled Virtual Avatar Mapping Using Optimized Knowledge Distillation	Jan 13, 2024	Emotion RecognitionKnowledge Distillation	—Unverified	0
Direct Distillation between Different Domains	Jan 12, 2024	Domain AdaptationKnowledge Distillation	—Unverified	0
An Empirical Investigation into the Effect of Parameter Choices in Knowledge Distillation	Jan 12, 2024	Knowledge Distillation	—Unverified	0
Graph Relation Distillation for Efficient Biomedical Instance Segmentation	Jan 12, 2024	Instance SegmentationKnowledge Distillation	CodeCode Available	1
Exploring Self- and Cross-Triplet Correlations for Human-Object Interaction Detection	Jan 11, 2024	Human-Object Interaction DetectionKnowledge Distillation	—Unverified	0
Attention to detail: inter-resolution knowledge distillation	Jan 11, 2024	Knowledge Distillationwhole slide images	CodeCode Available	0
Object-Centric Diffusion for Efficient Video Editing	Jan 11, 2024	Knowledge DistillationObject	—Unverified	0
Hierarchical Knowledge Distillation on Text Graph for Data-limited Attribute Inference	Jan 10, 2024	AttributeFew-Shot Learning	—Unverified	0
Translate-Distill: Learning Cross-Language Dense Retrieval by Translation and Distillation	Jan 9, 2024	Information RetrievalKnowledge Distillation	—Unverified	0
Logits Poisoning Attack in Federated Distillation	Jan 8, 2024	Federated LearningKnowledge Distillation	—Unverified	0
Multi-Channel Multi-Domain based Knowledge Distillation Algorithm for Sleep Staging with Single-Channel EEG	Jan 7, 2024	EEGKnowledge Distillation	—Unverified	0
SeqNAS: Neural Architecture Search for Event Sequence Classification	Jan 6, 2024	Bayesian OptimizationClassification	CodeCode Available	0
Progressive Knowledge Distillation Of Stable Diffusion XL Using Layer Level Loss	Jan 5, 2024	Knowledge Distillation	CodeCode Available	2
Bridging Modalities: Knowledge Distillation and Masked Training for Translating Multi-Modal Emotion Recognition to Uni-Modal, Speech-Only Emotion Recognition	Jan 4, 2024	Emotion RecognitionKnowledge Distillation	CodeCode Available	0
Distillation-based fabric anomaly detection	Jan 4, 2024	Anomaly DetectionDefect Detection	CodeCode Available	0
Exploring Vacant Classes in Label-Skewed Federated Learning	Jan 4, 2024	Federated LearningKnowledge Distillation	CodeCode Available	0
CTC Blank Triggered Dynamic Layer-Skipping for Efficient CTC-based Speech Recognition	Jan 4, 2024	Knowledge Distillationspeech-recognition	—Unverified	0
Distilling Temporal Knowledge with Masked Feature Reconstruction for 3D Object Detection	Jan 3, 2024	3D Object DetectionKnowledge Distillation	—Unverified	0
Self-supervised Reflective Learning through Self-distillation and Online Clustering for Speaker Representation Learning	Jan 3, 2024	ClusteringKnowledge Distillation	—Unverified	0
Exploring Hyperspectral Anomaly Detection with Human Vision: A Small Target Aware Detector	Jan 2, 2024	Anomaly DetectionKnowledge Distillation	CodeCode Available	0
HAAQI-Net: A Non-intrusive Neural Music Audio Quality Assessment Model for Hearing Aids	Jan 2, 2024	Audio Quality AssessmentAudio Signal Processing	CodeCode Available	1
Query-Based Knowledge Sharing for Open-Vocabulary Multi-Label Classification	Jan 2, 2024	Knowledge DistillationMulti-Label Classification	—Unverified	0
Dual Teacher Knowledge Distillation with Domain Alignment for Face Anti-spoofing	Jan 2, 2024	Adversarial AttackFace Anti-Spoofing	—Unverified	0
Distilling Local Texture Features for Colorectal Tissue Classification in Low Data Regimes	Jan 2, 2024	Knowledge Distillation	CodeCode Available	0

Show:10 25 50

← PrevPage 28 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified