Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3901–3950 of 4240 papers

Title	Date	Tasks	Status
Data-Efficient Ranking Distillation for Image Retrieval	Jul 10, 2020	Image RetrievalKnowledge Distillation	—Unverified
Knowledge Distillation Beyond Model Compression	Jul 3, 2020	Knowledge Distillationmodel	—Unverified
Interactive Knowledge Distillation	Jul 3, 2020	image-classificationImage Classification	—Unverified
SimulSpeech: End-to-End Simultaneous Speech to Text Translation	Jul 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Improving Autoregressive NMT with Non-Autoregressive Model	Jul 1, 2020	Decoderde-en	—Unverified
Xiaomi's Submissions for IWSLT 2020 Open Domain Translation Task	Jul 1, 2020	Domain AdaptationKnowledge Distillation	—Unverified
Exploring the Limits of Simple Learners in Knowledge Distillation for Document Classification with DocBERT	Jul 1, 2020	Document ClassificationGeneral Classification	—Unverified
CASIA's System for IWSLT 2020 Open Domain Translation	Jul 1, 2020	Knowledge DistillationMachine Translation	—Unverified
Extracurricular Learning: Knowledge Transfer Beyond Empirical Distribution	Jun 30, 2020	Image ClassificationKnowledge Distillation	—Unverified
On the Demystification of Knowledge Distillation: A Residual Network Perspective	Jun 30, 2020	Knowledge DistillationModel Compression	—Unverified
Interpreting and Disentangling Feature Components of Various Complexity from DNNs	Jun 29, 2020	Knowledge Distillation	CodeCode Available
Motion Pyramid Networks for Accurate and Efficient Cardiac Motion Estimation	Jun 28, 2020	Knowledge DistillationMotion Estimation	—Unverified
Diverse Knowledge Distillation (DKD): A Solution for Improving The Robustness of Ensemble Models Against Adversarial Attacks	Jun 26, 2020	Ensemble Learningimage-classification	—Unverified
Streaming Transformer ASR with Blockwise Synchronous Inference	Jun 25, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Distilling Object Detectors with Task Adaptive Regularization	Jun 23, 2020	Knowledge DistillationObject	—Unverified
Prior knowledge distillation based on financial time series	Jun 16, 2020	Knowledge DistillationTime Series	—Unverified
Multi-fidelity Neural Architecture Search with Knowledge Distillation	Jun 15, 2020	Knowledge DistillationNeural Architecture Search	CodeCode Available
Pixel Invisibility: Detecting Objects Invisible in Color Images	Jun 15, 2020	Knowledge Distillationobject-detection	—Unverified
Ensemble Distillation for Robust Model Fusion in Federated Learning	Jun 12, 2020	BIG-bench Machine LearningFederated Learning	CodeCode Available
Knowledge Distillation: A Survey	Jun 9, 2020	Knowledge DistillationModel Compression	—Unverified
Continual Representation Learning for Biometric Identification	Jun 8, 2020	Continual LearningKnowledge Distillation	CodeCode Available
Classification Under Misspecification: Halfspaces, Generalized Linear Models, and Connections to Evolvability	Jun 8, 2020	FairnessGeneral Classification	CodeCode Available
ResKD: Residual-Guided Knowledge Distillation	Jun 8, 2020	Knowledge Distillation	—Unverified
ADMP: An Adversarial Double Masks Based Pruning Framework For Unsupervised Cross-Domain Compression	Jun 7, 2020	Domain AdaptationKnowledge Distillation	—Unverified
An Empirical Analysis of the Impact of Data Augmentation on Knowledge Distillation	Jun 6, 2020	Data AugmentationKnowledge Distillation	—Unverified
An Overview of Neural Network Compression	Jun 5, 2020	Knowledge DistillationModel Compression	—Unverified
End-to-End Speech-Translation with Knowledge Distillation: FBK@IWSLT2020	Jun 4, 2020	Data AugmentationKnowledge Distillation	—Unverified
Distilling Image Dehazing With Heterogeneous Task Imitation	Jun 1, 2020	image-classificationImage Classification	CodeCode Available
Apprentissage automatique de repr\'esentation de voix \`a l'aide d'une distillation de la connaissance pour le casting vocal (Learning voice representation using knowledge distillation for automatic voice casting )	Jun 1, 2020	Knowledge Distillation	—Unverified
ADINet: Attribute Driven Incremental Network for Retinal Image Classification	Jun 1, 2020	AttributeClassification	—Unverified
Weight Squeezing: Reparameterization for Compression and Fast Inference	May 30, 2020	Knowledge DistillationModel Compression	—Unverified
Sub-Band Knowledge Distillation Framework for Speech Enhancement	May 29, 2020	Knowledge DistillationSpeech Enhancement	—Unverified
Syntactic Structure Distillation Pretraining For Bidirectional Encoders	May 27, 2020	Knowledge DistillationLanguage Modeling	—Unverified
Why distillation helps: a statistical perspective	May 21, 2020	Knowledge DistillationRetrieval	—Unverified
Learning from a Lightweight Teacher for Efficient Knowledge Distillation	May 19, 2020	Knowledge Distillation	—Unverified
Joint Progressive Knowledge Distillation and Unsupervised Domain Adaptation	May 16, 2020	Domain AdaptationKnowledge Distillation	CodeCode Available
Incremental Learning for End-to-End Automatic Speech Recognition	May 11, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Distilling Knowledge from Pre-trained Language Models via Text Smoothing	May 8, 2020	Knowledge DistillationLanguage Modeling	—Unverified
Improving Non-autoregressive Neural Machine Translation with Monolingual Data	May 2, 2020	Data AugmentationKnowledge Distillation	—Unverified
Distilling Spikes: Knowledge Distillation in Spiking Neural Networks	May 1, 2020	image-classificationImage Classification	—Unverified
General Purpose Text Embeddings from Pre-trained Language Models for Scalable Inference	Apr 29, 2020	Knowledge DistillationQuantization	—Unverified
LightPAFF: A Two-Stage Distillation Framework for Pre-training and Fine-tuning	Apr 27, 2020	Knowledge DistillationLanguage Modeling	—Unverified
A Tailored Pre-Training Model for Task-Oriented Dialog Generation	Apr 24, 2020	Knowledge DistillationLanguage Modeling	CodeCode Available
A Study of Non-autoregressive Model for Sequence Generation	Apr 22, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Knowledge Distillation for Multilingual Unsupervised Neural Machine Translation	Apr 21, 2020	DecoderKnowledge Distillation	—Unverified
Knowledge Distillation for Action Anticipation via Label Smoothing	Apr 16, 2020	Action AnticipationAutonomous Driving	—Unverified
Building a Multi-domain Neural Machine Translation Model using Knowledge Distillation	Apr 15, 2020	Domain AdaptationKnowledge Distillation	—Unverified
Towards Robust Classification with Image Quality Assessment	Apr 14, 2020	ClassificationGeneral Classification	—Unverified
Smart Inference for Multidigit Convolutional Neural Network based Barcode Decoding	Apr 14, 2020	Knowledge Distillation	—Unverified
XtremeDistil: Multi-stage Distillation for Massive Multilingual Models	Apr 12, 2020	Knowledge Distillationnamed-entity-recognition	—Unverified

Show:10 25 50

← PrevPage 79 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified