Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2951–3000 of 4240 papers

Title	Date	Tasks	Status
Continual Learning for Class- and Domain-Incremental Semantic Segmentation	Sep 16, 2022	class-incremental learningClass Incremental Learning	—Unverified
CES-KD: Curriculum-based Expert Selection for Guided Knowledge Distillation	Sep 15, 2022	Knowledge Distillation	—Unverified
Layerwise Bregman Representation Learning with Applications to Knowledge Distillation	Sep 15, 2022	Knowledge DistillationRepresentation Learning	—Unverified
PlaStIL: Plastic and Stable Memory-Free Class-Incremental Learning	Sep 14, 2022	class-incremental learningClass Incremental Learning	—Unverified
TASKED: Transformer-based Adversarial learning for human activity recognition using wearable sensors via Self-KnowledgE Distillation	Sep 14, 2022	Activity RecognitionHuman Activity Recognition	—Unverified
Multi-stage Distillation Framework for Cross-Lingual Semantic Similarity Matching	Sep 13, 2022	Contrastive LearningKnowledge Distillation	CodeCode Available
Online Continual Learning via the Meta-learning Update with Multi-scale Knowledge Distillation and Data Augmentation	Sep 12, 2022	Continual LearningData Augmentation	—Unverified
Preserving Privacy in Federated Learning with Ensemble Cross-Domain Knowledge Distillation	Sep 10, 2022	Federated Learningimage-classification	—Unverified
Selecting Related Knowledge via Efficient Channel Attention for Online Continual Learning	Sep 9, 2022	Continual LearningKnowledge Distillation	—Unverified
In-situ animal behavior classification using knowledge distillation and fixed-point quantization	Sep 9, 2022	ClassificationKnowledge Distillation	—Unverified
Exploring Target Representations for Masked Autoencoders	Sep 8, 2022	Image ClassificationInstance Segmentation	CodeCode Available
ViTKD: Practical Guidelines for ViT feature knowledge distillation	Sep 6, 2022	Image ClassificationKnowledge Distillation	—Unverified
A Novel Self-Knowledge Distillation Approach with Siamese Representation Learning for Action Recognition	Sep 3, 2022	Action RecognitionKnowledge Distillation	—Unverified
Knowledge Distillation for Sustainable Neural Machine Translation	Sep 1, 2022	Knowledge DistillationMachine Translation	—Unverified
Dynamics-Adaptive Continual Reinforcement Learning via Progressive Contextualization	Sep 1, 2022	Bayesian InferenceKnowledge Distillation	—Unverified
FAKD: Feature Augmented Knowledge Distillation for Semantic Segmentation	Aug 30, 2022	Knowledge DistillationSegmentation	CodeCode Available
Dynamic Data-Free Knowledge Distillation by Easy-to-Hard Learning Strategy	Aug 29, 2022	Data-free Knowledge DistillationKnowledge Distillation	CodeCode Available
Removing Rain Streaks via Task Transfer Learning	Aug 28, 2022	Knowledge DistillationRain Removal	—Unverified
Goal-Conditioned Q-Learning as Knowledge Distillation	Aug 28, 2022	Knowledge DistillationQ-Learning	CodeCode Available
Unsupervised Spike Depth Estimation via Cross-modality Cross-domain Knowledge Transfer	Aug 26, 2022	Autonomous DrivingDepth Estimation	CodeCode Available
Dense Depth Distillation with Out-of-Distribution Simulated Images	Aug 26, 2022	Data-free Knowledge DistillationDepth Estimation	—Unverified
Debias the Black-box: A Fair Ranking Framework via Knowledge Distillation	Aug 24, 2022	FairnessInformation Retrieval	—Unverified
Lifelong Learning for Neural powered Mixed Integer Programming	Aug 24, 2022	Graph AttentionKnowledge Distillation	—Unverified
FS-BAN: Born-Again Networks for Domain Generalization Few-Shot Classification	Aug 23, 2022	Domain GeneralizationKnowledge Distillation	CodeCode Available
Multi-View Attention Transfer for Efficient Speech Enhancement	Aug 22, 2022	Knowledge DistillationSpeech Enhancement	—Unverified
Rethinking Knowledge Distillation via Cross-Entropy	Aug 22, 2022	Knowledge Distillation	—Unverified
RAIN: RegulArization on Input and Network for Black-Box Domain Adaptation	Aug 22, 2022	Data AugmentationDomain Adaptation	CodeCode Available
Combining Compressions for Multiplicative Size Scaling on Natural Language Tasks	Aug 20, 2022	Knowledge DistillationNeural Network Compression	—Unverified
Effectiveness of Function Matching in Driving Scene Recognition	Aug 20, 2022	Autonomous Drivingimage-classification	—Unverified
Quantifying the Knowledge in a DNN to Explain Knowledge Distillation for Classification	Aug 18, 2022	3D Point Cloud ClassificationClassification	—Unverified
Leukocyte Classification using Multimodal Architecture Enhanced by Knowledge Distillation	Aug 17, 2022	ClassificationKnowledge Distillation	—Unverified
Progressive Cross-modal Knowledge Distillation for Human Action Recognition	Aug 17, 2022	Action RecognitionKnowledge Distillation	—Unverified
Unsupervised Domain Adaptation for Segmentation with Black-box Source Model	Aug 16, 2022	Domain AdaptationKnowledge Distillation	—Unverified
RAWtoBit: A Fully End-to-end Camera ISP Network	Aug 16, 2022	Image CompressionKnowledge Distillation	—Unverified
Enhancing Heterogeneous Federated Learning with Knowledge Extraction and Multi-Model Fusion	Aug 16, 2022	Federated LearningKnowledge Distillation	CodeCode Available
A Knowledge Distillation-Based Backdoor Attack in Federated Learning	Aug 12, 2022	Backdoor AttackFederated Learning	—Unverified
Non-Autoregressive Sign Language Production via Knowledge Distillation	Aug 12, 2022	Knowledge DistillationSign Language Production	—Unverified
BEiT v2: Masked Image Modeling with Vector-Quantized Visual Tokenizers	Aug 12, 2022	image-classificationImage Classification	CodeCode Available
Self-Knowledge Distillation via Dropout	Aug 11, 2022	Adversarial Robustnessimage-classification	—Unverified
SKDCGN: Source-free Knowledge Distillation of Counterfactual Generative Networks using cGANs	Aug 8, 2022	counterfactualKnowledge Distillation	CodeCode Available
Label Semantic Knowledge Distillation for Unbiased Scene Graph Generation	Aug 7, 2022	Graph GenerationKnowledge Distillation	—Unverified
Study of Encoder-Decoder Architectures for Code-Mix Search Query Translation	Aug 7, 2022	Data AugmentationDecoder	—Unverified
PGX: A Multi-level GNN Explanation Framework Based on Separate Knowledge Distillation Processes	Aug 5, 2022	Knowledge DistillationRepresentation Learning	—Unverified
Task-Balanced Distillation for Object Detection	Aug 5, 2022	ClassificationKnowledge Distillation	—Unverified
Deep Semi-Supervised and Self-Supervised Learning for Diabetic Retinopathy Detection	Aug 4, 2022	Diabetic Retinopathy DetectionKnowledge Distillation	—Unverified
Pose Uncertainty Aware Movement Synchrony Estimation via Spatial-Temporal Graph Transformer	Aug 1, 2022	Activity RecognitionContrastive Learning	—Unverified
SDBERT: SparseDistilBERT, a faster and smaller BERT model	Jul 28, 2022	Knowledge Distillation	—Unverified
NICEST: Noisy Label Correction and Training for Robust Scene Graph Generation	Jul 27, 2022	Graph GenerationKnowledge Distillation	—Unverified
Exploring Generalizable Distillation for Efficient Medical Image Segmentation	Jul 26, 2022	DecoderImage Segmentation	CodeCode Available
Few-Shot Object Detection by Knowledge Distillation Using Bag-of-Visual-Words Representations	Jul 25, 2022	Few-Shot Object DetectionKnowledge Distillation	—Unverified

Show:10 25 50

← PrevPage 60 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified