Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3801–3850 of 4240 papers

Title	Date	Tasks	Status
ProxylessKD: Direct Knowledge Distillation with Inherited Classifier for Face Recognition	Oct 31, 2020	Face RecognitionKnowledge Distillation	—Unverified
Cross-lingual Machine Reading Comprehension with Language Branch Knowledge Distillation	Oct 27, 2020	Knowledge DistillationMachine Reading Comprehension	—Unverified
Activation Map Adaptation for Effective Knowledge Distillation	Oct 26, 2020	Knowledge DistillationModel Compression	—Unverified
Empowering Knowledge Distillation via Open Set Recognition for Robust 3D Point Cloud Classification	Oct 25, 2020	3D Point Cloud ClassificationGeneral Classification	—Unverified
Two-stage Textual Knowledge Distillation for End-to-End Spoken Language Understanding	Oct 25, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Pre-trained Summarization Distillation	Oct 24, 2020	Knowledge DistillationMachine Translation	CodeCode Available
Improved Synthetic Training for Reading Comprehension	Oct 24, 2020	Knowledge DistillationMachine Reading Comprehension	—Unverified
Iterative Graph Self-Distillation	Oct 23, 2020	Contrastive LearningGraph Learning	—Unverified
Generating Long Financial Report using Conditional Variational Autoencoders with Knowledge Distillation	Oct 23, 2020	DecoderKnowledge Distillation	—Unverified
Knowledge Distillation for Improved Accuracy in Spoken Question Answering	Oct 21, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Contextualized Attention-based Knowledge Transfer for Spoken Conversational Question Answering	Oct 21, 2020	Audio Signal ProcessingConversational Question Answering	—Unverified
Knowledge Distillation in Wide Neural Networks: Risk Bound, Data Efficiency and Imperfect Teacher	Oct 20, 2020	Knowledge DistillationModel Compression	—Unverified
Fast Video Salient Object Detection via Spatiotemporal Knowledge Distillation	Oct 20, 2020	Knowledge DistillationObject	—Unverified
Edge Bias in Federated Learning and its Solution by Buffered Knowledge Distillation	Oct 20, 2020	Federated LearningKnowledge Distillation	—Unverified
Noisy Neural Network Compression for Analog Storage Devices	Oct 19, 2020	Knowledge DistillationModel Compression	—Unverified
Comparing Fisher Information Regularization with Distillation for DNN Quantization	Oct 19, 2020	Knowledge DistillationQuantization	—Unverified
Infusing Sequential Information into Conditional Masked Translation Model with Self-Review Mechanism	Oct 19, 2020	DecoderKnowledge Distillation	CodeCode Available
AutoADR: Automatic Model Design for Ad Relevance	Oct 14, 2020	AutoMLKnowledge Distillation	—Unverified
MulDE: Multi-teacher Knowledge Distillation for Low-dimensional Knowledge Graph Embeddings	Oct 14, 2020	Graph EmbeddingKnowledge Distillation	—Unverified
Dual-mode ASR: Unify and Improve Streaming ASR with Full-context Modeling	Oct 12, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Collective Wisdom: Improving Low-resource Neural Machine Translation using Adaptive Knowledge Distillation	Oct 12, 2020	Knowledge DistillationLow Resource Neural Machine Translation	—Unverified
Structural Knowledge Distillation: Tractably Distilling Information for Structured Predictor	Oct 10, 2020	Dependency ParsingKnowledge Distillation	CodeCode Available
Adversarial Self-Supervised Data-Free Distillation for Text Classification	Oct 10, 2020	ClassificationGeneral Classification	—Unverified
Distilling a Deep Neural Network into a Takagi-Sugeno-Kang Fuzzy Inference System	Oct 10, 2020	General ClassificationKnowledge Distillation	—Unverified
Locally Linear Region Knowledge Distillation	Oct 9, 2020	Knowledge Distillation	—Unverified
Be Your Own Best Competitor! Multi-Branched Adversarial Knowledge Transfer	Oct 9, 2020	Decoderimage-classification	—Unverified
Galileo at SemEval-2020 Task 12: Multi-lingual Learning for Offensive Language Identification using Pre-trained Language Models	Oct 7, 2020	AllKnowledge Distillation	—Unverified
DiPair: Fast and Accurate Distillation for Trillion-Scale Text Matching and Pair Modeling	Oct 7, 2020	Knowledge DistillationQuestion Answering	—Unverified
Deep Representation Learning of Patient Data from Electronic Health Records (EHR): A Systematic Review	Oct 6, 2020	ArticlesDeep Learning	—Unverified
Why Skip If You Can Combine: A Simple Knowledge Distillation Technique for Intermediate Layers	Oct 6, 2020	Knowledge DistillationMachine Translation	CodeCode Available
A Survey on Deep Neural Network Compression: Challenges, Overview, and Solutions	Oct 5, 2020	Knowledge DistillationMiscellaneous	—Unverified
Towards Cross-modality Medical Image Segmentation with Online Mutual Knowledge Distillation	Oct 4, 2020	Cardiac SegmentationImage Segmentation	—Unverified
Neighbourhood Distillation: On the benefits of non end-to-end distillation	Oct 2, 2020	Knowledge DistillationNeural Architecture Search	—Unverified
Online Knowledge Distillation via Multi-branch Diversity Enhancement	Oct 2, 2020	Diversityimage-classification	—Unverified
WeChat Neural Machine Translation Systems for WMT20	Oct 1, 2020	Knowledge DistillationMachine Translation	—Unverified
Improved Knowledge Distillation via Full Kernel Matrix Transfer	Sep 30, 2020	Knowledge DistillationModel Compression	CodeCode Available
Pea-KD: Parameter-efficient and Accurate Knowledge Distillation on BERT	Sep 30, 2020	Knowledge DistillationModel Compression	—Unverified
Stochastic Precision Ensemble: Self-Knowledge Distillation for Quantized Deep Neural Networks	Sep 30, 2020	image-classificationImage Classification	—Unverified
Distillation of Weighted Automata from Recurrent Neural Networks using a Spectral Approach	Sep 28, 2020	Knowledge DistillationLanguage Modelling	—Unverified
Kernel Based Progressive Distillation for Adder Neural Networks	Sep 28, 2020	Knowledge Distillation	—Unverified
Pea-KD: Parameter-efficient and accurate Knowledge Distillation	Sep 28, 2020	Knowledge DistillationModel Compression	—Unverified
TernaryBERT: Distillation-aware Ultra-low Bit BERT	Sep 27, 2020	Knowledge DistillationQuantization	CodeCode Available
Multi-Frame to Single-Frame: Knowledge Distillation for 3D Object Detection	Sep 24, 2020	3D Object DetectionAutonomous Driving	—Unverified
Sim-to-Real Transfer in Deep Reinforcement Learning for Robotics: a Survey	Sep 24, 2020	Deep Reinforcement LearningDomain Adaptation	—Unverified
Open-set Short Utterance Forensic Speaker Verification using Teacher-Student Network with Explicit Inductive Bias	Sep 21, 2020	Inductive BiasKnowledge Distillation	—Unverified
EI-MTD:Moving Target Defense for Edge Intelligence against Adversarial Attacks	Sep 19, 2020	Knowledge DistillationScheduling	—Unverified
Weight Distillation: Transferring the Knowledge in Neural Network Parameters	Sep 19, 2020	Knowledge DistillationMachine Translation	—Unverified
Introspective Learning by Distilling Knowledge from Online Self-explanation	Sep 19, 2020	Knowledge Distillation	—Unverified
Efficient Transformer-based Large Scale Language Representations using Hardware-friendly Block Structured Pruning	Sep 17, 2020	Edge-computingKnowledge Distillation	—Unverified
Mimic and Conquer: Heterogeneous Tree Structure Distillation for Syntactic NLP	Sep 16, 2020	Knowledge Distillation	—Unverified

Show:10 25 50

← PrevPage 77 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified