Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1651–1700 of 4240 papers

Title	Date	Tasks	Status	Hype
Facilitating NSFW Text Detection in Open-Domain Dialogue Systems via Knowledge Distillation	Sep 18, 2023	ChatbotKnowledge Distillation	CodeCode Available	0
Distilling HuBERT with LSTMs via Decoupled Knowledge Distillation	Sep 18, 2023	Automatic Speech RecognitionKnowledge Distillation	—Unverified	0
DFIL: Deepfake Incremental Learning by Exploiting Domain-invariant Forgery Clues	Sep 18, 2023	Continual LearningContrastive Learning	CodeCode Available	1
Heterogeneous Generative Knowledge Distillation with Masked Image Modeling	Sep 18, 2023	image-classificationImage Classification	—Unverified	0
FDCNet: Feature Drift Compensation Network for Class-Incremental Weakly Supervised Object Localization	Sep 17, 2023	class-incremental learningIncremental Learning	CodeCode Available	1
UNIDEAL: Curriculum Knowledge Distillation Federated Learning	Sep 16, 2023	Federated LearningKnowledge Distillation	—Unverified	0
One-Class Knowledge Distillation for Spoofing Speech Detection	Sep 15, 2023	Binary ClassificationKnowledge Distillation	—Unverified	0
Privacy-preserving Early Detection of Epileptic Seizures in Videos	Sep 15, 2023	Knowledge DistillationOptical Flow Estimation	CodeCode Available	0
Cross-lingual Knowledge Distillation via Flow-based Voice Conversion for Robust Polyglot Text-To-Speech	Sep 15, 2023	Knowledge DistillationSpeech Synthesis	—Unverified	0
Two-Step Knowledge Distillation for Tiny Speech Enhancement	Sep 15, 2023	Knowledge DistillationModel Compression	—Unverified	0
Adaptive Prompt Learning with Distilled Connective Knowledge for Implicit Discourse Relation Recognition	Sep 14, 2023	Knowledge DistillationPrompt Learning	CodeCode Available	0
ChromaDistill: Colorizing Monochrome Radiance Fields with Knowledge Distillation	Sep 14, 2023	3DGSColorization	—Unverified	0
CoLLD: Contrastive Layer-to-layer Distillation for Compressing Multilingual Pre-trained Speech Encoders	Sep 14, 2023	Contrastive LearningKnowledge Distillation	—Unverified	0
A Novel Local-Global Feature Fusion Framework for Body-weight Exercise Recognition with Pressure Mapping Sensors	Sep 14, 2023	Knowledge Distillationobject-detection	—Unverified	0
Continual Learning with Dirichlet Generative-based Rehearsal	Sep 13, 2023	Continual LearningIncremental Learning	—Unverified	0
Self-Training and Multi-Task Learning for Limited Data: Evaluation Study on Object Detection	Sep 12, 2023	Knowledge DistillationMulti-Task Learning	—Unverified	0
KD-FixMatch: Knowledge Distillation Siamese Neural Networks	Sep 11, 2023	Knowledge Distillation	—Unverified	0
DeViT: Decomposing Vision Transformers for Collaborative Inference in Edge Devices	Sep 10, 2023	Collaborative InferenceGPU	—Unverified	0
DAD++: Improved Data-free Test Time Adversarial Defense	Sep 10, 2023	Adversarial DefenseAdversarial Robustness	CodeCode Available	0
Exploiting CLIP for Zero-shot HOI Detection Requires Knowledge Distillation at Multiple Levels	Sep 10, 2023	Human-Object Interaction DetectionKnowledge Distillation	CodeCode Available	0
Speech Emotion Recognition with Distilled Prosodic and Linguistic Affect Representations	Sep 9, 2023	Emotion RecognitionKnowledge Distillation	—Unverified	0
Decoding visual brain representations from electroencephalography through Knowledge Distillation and latent diffusion models	Sep 8, 2023	Brain DecodingEEG	CodeCode Available	0
Knowledge Distillation-Empowered Digital Twin for Anomaly Detection	Sep 8, 2023	Anomaly DetectionKnowledge Distillation	—Unverified	0
Towards Mitigating Architecture Overfitting on Distilled Datasets	Sep 8, 2023	Dataset DistillationKnowledge Distillation	CodeCode Available	0
3D Denoisers are Good 2D Teachers: Molecular Pretraining via Denoising and Cross-Modal Distillation	Sep 8, 2023	DenoisingKnowledge Distillation	—Unverified	0
Towards Comparable Knowledge Distillation in Semantic Image Segmentation	Sep 7, 2023	Image SegmentationKnowledge Distillation	—Unverified	0
Leveraging ASR Pretrained Conformers for Speaker Verification through Transfer Learning and Knowledge Distillation	Sep 6, 2023	Knowledge DistillationSpeaker Verification	—Unverified	0
Knowledge Distillation Layer that Lets the Student Decide	Sep 6, 2023	Knowledge Distillation	CodeCode Available	0
DMKD: Improving Feature-based Knowledge Distillation for Object Detection Via Dual Masking Augmentation	Sep 6, 2023	Knowledge Distillationobject-detection	—Unverified	0
Rethinking Momentum Knowledge Distillation in Online Continual Learning	Sep 6, 2023	Continual LearningKnowledge Distillation	CodeCode Available	1
A deep Natural Language Inference predictor without language-specific training data	Sep 6, 2023	Aspect-Based Sentiment AnalysisKnowledge Distillation	—Unverified	0
Fast and High-Performance Learned Image Compression With Improved Checkerboard Context Model, Deformable Residual Module, and Knowledge Distillation	Sep 5, 2023	Image CompressionKnowledge Distillation	—Unverified	0
TODM: Train Once Deploy Many Efficient Supernet-Based RNN-T Compression For On-device ASR Models	Sep 5, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Probabilistic Self-supervised Learning via Scoring Rules Minimization	Sep 5, 2023	Knowledge DistillationOut-of-Distribution Detection	—Unverified	0
A survey on efficient vision transformers: algorithms, techniques, and performance benchmarking	Sep 5, 2023	BenchmarkingKnowledge Distillation	—Unverified	0
On the Query Strategies for Efficient Online Active Distillation	Sep 4, 2023	Active LearningContinual Learning	—Unverified	0
Prior Knowledge Guided Network for Video Anomaly Detection	Sep 4, 2023	Anomaly DetectionKnowledge Distillation	—Unverified	0
COMEDIAN: Self-Supervised Learning and Knowledge Distillation for Action Spotting using Transformers	Sep 3, 2023	Action DetectionAction Spotting	CodeCode Available	1
Knowledge Distillation from Non-streaming to Streaming ASR Encoder using Auxiliary Non-streaming Layer	Aug 31, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Adversarial Finetuning with Latent Representation Constraint to Mitigate Accuracy-Robustness Tradeoff	Aug 31, 2023	Knowledge Distillation	—Unverified	0
MoMA: Momentum Contrastive Learning with Multi-head Attention-based Knowledge Distillation for Histopathology Image Analysis	Aug 31, 2023	Contrastive LearningKnowledge Distillation	CodeCode Available	0
Towards Long-Tailed Recognition for Graph Classification via Collaborative Experts	Aug 31, 2023	Contrastive LearningGraph Classification	—Unverified	0
Exploring Multi-Modal Contextual Knowledge for Open-Vocabulary Object Detection	Aug 30, 2023	Knowledge DistillationLanguage Modeling	—Unverified	0
SpikeBERT: A Language Spikformer Learned from BERT with Knowledge Distillation	Aug 29, 2023	Knowledge Distillationtext-classification	CodeCode Available	1
SynthDistill: Face Recognition with Knowledge Distillation from Synthetic Data	Aug 28, 2023	Face RecognitionKnowledge Distillation	CodeCode Available	0
Bridging Cross-task Protocol Inconsistency for Distillation in Dense Object Detection	Aug 28, 2023	Binary ClassificationClassification	CodeCode Available	1
Distilled GPT for Source Code Summarization	Aug 28, 2023	Code SummarizationGPU	CodeCode Available	0
Boosting Residual Networks with Group Knowledge	Aug 26, 2023	Knowledge Distillation	CodeCode Available	0
DM-VTON: Distilled Mobile Real-time Virtual Try-On	Aug 26, 2023	GPUHuman Parsing	CodeCode Available	1
Improving Knowledge Distillation for BERT Models: Loss Functions, Mapping Methods, and Weight Tuning	Aug 26, 2023	Knowledge DistillationModel Compression	—Unverified	0

Show:10 25 50

← PrevPage 34 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified