Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3151–3200 of 4240 papers

Title	Date	Tasks	Status
Using Explainable Boosting Machine to Compare Idiographic and Nomothetic Approaches for Ecological Momentary Assessment Data	Apr 4, 2022	Interpretable Machine LearningKnowledge Distillation	—Unverified
Co-Teaching for Unsupervised Domain Adaptation and Expansion	Apr 4, 2022	Domain Adaptationimage-classification	CodeCode Available
CDKT-FL: Cross-Device Knowledge Transfer using Proxy Dataset in Federated Learning	Apr 4, 2022	Federated LearningKnowledge Distillation	—Unverified
DST: Dynamic Substitute Training for Data-free Black-box Attack	Apr 3, 2022	Knowledge Distillation	—Unverified
A Dual-Contrastive Framework for Low-Resource Cross-Lingual Named Entity Recognition	Apr 2, 2022	Contrastive LearningCross-Lingual NER	CodeCode Available
CL-XABSA: Contrastive Learning for Cross-lingual Aspect-based Sentiment Analysis	Apr 2, 2022	Aspect-Based Sentiment AnalysisAspect-Based Sentiment Analysis (ABSA)	CodeCode Available
Fast Real-time Personalized Speech Enhancement: End-to-End Enhancement Network (E3Net) and Knowledge Distillation	Apr 2, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Rethinking Position Bias Modeling with Knowledge Distillation for CTR Prediction	Apr 1, 2022	Click-Through Rate PredictionKnowledge Distillation	—Unverified
Preventing Distillation-based Attacks on Neural Network IP	Apr 1, 2022	Knowledge Distillation	—Unverified
Knowledge distillation with error-correcting transfer learning for wind power prediction	Apr 1, 2022	Knowledge DistillationTransfer Learning	—Unverified
Unified and Effective Ensemble Knowledge Distillation	Apr 1, 2022	Knowledge DistillationTransfer Learning	—Unverified
Adversarial Speaker Distillation for Countermeasure Model on Automatic Speaker Verification	Mar 31, 2022	Knowledge DistillationSpeaker Verification	—Unverified
A Closer Look at Rehearsal-Free Continual Learning	Mar 31, 2022	Continual LearningKnowledge Distillation	—Unverified
Conditional Autoregressors are Interpretable Classifiers	Mar 31, 2022	Classificationimage-classification	—Unverified
Device-Directed Speech Detection: Regularization via Distillation for Weakly-Supervised Models	Mar 30, 2022	Knowledge Distillation	—Unverified
RAVIR: A Dataset and Methodology for the Semantic Segmentation and Quantitative Analysis of Retinal Arteries and Veins in Infrared Reflectance Imaging	Mar 28, 2022	Domain AdaptationKnowledge Distillation	—Unverified
Doodle It Yourself: Class Incremental Learning by Drawing a Few Sketches	Mar 28, 2022	class-incremental learningClass Incremental Learning	—Unverified
Knowledge Distillation: Bad Models Can Be Good Role Models	Mar 28, 2022	Knowledge DistillationLearning Theory	—Unverified
A Cross-Domain Approach for Continuous Impression Recognition from Dyadic Audio-Visual-Physio Signals	Mar 25, 2022	Knowledge DistillationSpoken Dialogue Systems	—Unverified
Class-Incremental Learning for Action Recognition in Videos	Mar 25, 2022	Action RecognitionAction Recognition In Videos	—Unverified
Multitask Emotion Recognition Model with Knowledge Distillation and Task Discriminator	Mar 24, 2022	Emotion RecognitionKnowledge Distillation	—Unverified
Scale-Equivalent Distillation for Semi-Supervised Object Detection	Mar 23, 2022	Knowledge DistillationObject	—Unverified
Towards Expressive Speaking Style Modelling with Hierarchical Context Information for Mandarin Speech Synthesis	Mar 23, 2022	Expressive Speech SynthesisKnowledge Distillation	—Unverified
Mitigating Gender Bias in Distilled Language Models via Counterfactual Role Reversal	Mar 23, 2022	counterfactualFairness	—Unverified
On Neural Network Equivalence Checking using SMT Solvers	Mar 22, 2022	Knowledge Distillation	—Unverified
Channel Self-Supervision for Online Knowledge Distillation	Mar 22, 2022	DiversityKnowledge Distillation	—Unverified
Emulating Quantum Dynamics with Neural Networks via Knowledge Distillation	Mar 19, 2022	Knowledge Distillation	CodeCode Available
A Closer Look at Knowledge Distillation with Features, Logits, and Gradients	Mar 18, 2022	Incremental LearningKnowledge Distillation	—Unverified
Delta Distillation for Efficient Video Processing	Mar 17, 2022	Knowledge Distillationobject-detection	CodeCode Available
SC2 Benchmark: Supervised Compression for Split Computing	Mar 16, 2022	Data CompressionEdge-computing	—Unverified
Domain Adaptive Hand Keypoint and Pixel Localization in the Wild	Mar 16, 2022	Domain AdaptationKnowledge Distillation	—Unverified
Sample, Translate, Recombine: Leveraging Audio Alignments for Data Augmentation in End-to-end Speech Translation	Mar 16, 2022	Data AugmentationKnowledge Distillation	—Unverified
On the benefits of knowledge distillation for adversarial robustness	Mar 14, 2022	Adversarial RobustnessKnowledge Distillation	—Unverified
DS3-Net: Difficulty-perceived Common-to-T1ce Semi-Supervised Multimodal MRI Synthesis Network	Mar 14, 2022	Knowledge DistillationSSIM	—Unverified
CEKD:Cross Ensemble Knowledge Distillation for Augmented Fine-grained Data	Mar 13, 2022	Data AugmentationKnowledge Distillation	—Unverified
Enabling Multimodal Generation on CLIP via Vision-Language Knowledge Distillation	Mar 12, 2022	Image CaptioningKnowledge Distillation	—Unverified
Wavelet Knowledge Distillation: Towards Efficient Image-to-Image Translation	Mar 12, 2022	Image-to-Image TranslationKnowledge Distillation	—Unverified
Medical Image Segmentation on MRI Images with Missing Modalities: A Review	Mar 11, 2022	Image GenerationImage Segmentation	—Unverified
Deep Class Incremental Learning from Decentralized Data	Mar 11, 2022	class-incremental learningClass Incremental Learning	CodeCode Available
Look Backward and Forward: Self-Knowledge Distillation with Bidirectional Decoder for Neural Machine Translation	Mar 10, 2022	DecoderKnowledge Distillation	—Unverified
Improving Neural ODEs via Knowledge Distillation	Mar 10, 2022	Knowledge Distillation	—Unverified
Model-Architecture Co-Design for High Performance Temporal GNN Inference on FPGA	Mar 10, 2022	Knowledge Distillation	CodeCode Available
Membership Privacy Protection for Image Translation Models via Adversarial Knowledge Distillation	Mar 10, 2022	Image-to-Image TranslationInference Attack	—Unverified
How many Observations are Enough? Knowledge Distillation for Trajectory Forecasting	Mar 9, 2022	Knowledge DistillationTrajectory Forecasting	—Unverified
Efficient Sub-structured Knowledge Distillation	Mar 9, 2022	Knowledge DistillationStructured Prediction	CodeCode Available
PyNET-QxQ: An Efficient PyNET Variant for QxQ Bayer Pattern Demosaicing in CMOS Image Sensors	Mar 8, 2022	DemosaickingKnowledge Distillation	CodeCode Available
On Generalizing Beyond Domains in Cross-Domain Continual Learning	Mar 8, 2022	Continual LearningKnowledge Distillation	—Unverified
Multi-trial Neural Architecture Search with Lottery Tickets	Mar 8, 2022	Knowledge DistillationNeural Architecture Search	—Unverified
Enhance Language Identification using Dual-mode Model with Knowledge Distillation	Mar 7, 2022	Knowledge DistillationLanguage Identification	CodeCode Available
Student Becomes Decathlon Master in Retinal Vessel Segmentation via Dual-teacher Multi-target Domain Adaptation	Mar 7, 2022	Domain AdaptationDomain Generalization	CodeCode Available

Show:10 25 50

← PrevPage 64 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified