Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2401–2450 of 4240 papers

Title	Date	Tasks	Status
Leveraging Expert Models for Training Deep Neural Networks in Scarce Data Domains: Application to Offline Handwritten Signature Verification	Aug 2, 2023	Knowledge Distillation	—Unverified
A vision transformer-based framework for knowledge transfer from multi-modal to mono-modal lymphoma subtyping models	Aug 2, 2023	Knowledge DistillationTransfer Learning	—Unverified
Three Factors to Improve Out-of-Distribution Detection	Aug 2, 2023	Contrastive LearningKnowledge Distillation	—Unverified
Spatio-Temporal Branching for Motion Prediction using Motion Increments	Aug 2, 2023	Human motion predictionKnowledge Distillation	CodeCode Available
Towards Better Query Classification with Multi-Expert Knowledge Condensation in JD Ads Search	Aug 2, 2023	Knowledge Distillation	—Unverified
Ada-DQA: Adaptive Diverse Quality-aware Feature Acquisition for Video Quality Assessment	Aug 1, 2023	DiversityKnowledge Distillation	—Unverified
Subspace Distillation for Continual Learning	Jul 31, 2023	Continual LearningKnowledge Distillation	CodeCode Available
Sampling to Distill: Knowledge Transfer from Open-World Data	Jul 31, 2023	Data-free Knowledge DistillationKnowledge Distillation	—Unverified
Federated Learning for Data and Model Heterogeneity in Medical Imaging	Jul 31, 2023	Federated LearningKnowledge Distillation	—Unverified
Can Self-Supervised Representation Learning Methods Withstand Distribution Shifts and Corruptions?	Jul 31, 2023	Contrastive LearningKnowledge Distillation	CodeCode Available
UPFL: Unsupervised Personalized Federated Learning towards New Clients	Jul 29, 2023	Federated LearningKnowledge Distillation	CodeCode Available
Incrementally-Computable Neural Networks: Efficient Inference for Dynamic Inputs	Jul 27, 2023	Document ClassificationKnowledge Distillation	—Unverified
Mitigating Cross-client GANs-based Attack in Federated Learning	Jul 25, 2023	Data-free Knowledge DistillationFederated Learning	—Unverified
A Good Student is Cooperative and Reliable: CNN-Transformer Collaborative Learning for Semantic Segmentation	Jul 24, 2023	Knowledge DistillationSemantic Segmentation	—Unverified
HeteFedRec: Federated Recommender Systems with Model Heterogeneity	Jul 24, 2023	Knowledge Distillationmodel	—Unverified
Distribution Shift Matters for Knowledge Distillation with Webly Collected Images	Jul 21, 2023	Contrastive LearningData-free Knowledge Distillation	—Unverified
Model Compression Methods for YOLOv5: A Review	Jul 21, 2023	Knowledge Distillationmodel	—Unverified
Quantized Feature Distillation for Network Quantization	Jul 20, 2023	image-classificationImage Classification	—Unverified
Cluster-aware Semi-supervised Learning: Relational Knowledge Distillation Provably Learns Clustering	Jul 20, 2023	ClusteringData Augmentation	CodeCode Available
LightPath: Lightweight and Scalable Path Representation Learning	Jul 19, 2023	Knowledge DistillationRelational Reasoning	CodeCode Available
Teach model to answer questions after comprehending the document	Jul 18, 2023	Knowledge DistillationMachine Reading Comprehension	—Unverified
Knowledge Distillation for Object Detection: from generic to remote sensing datasets	Jul 18, 2023	Knowledge DistillationModel Compression	—Unverified
Improving End-to-End Speech Translation by Imitation-Based Knowledge Distillation with Synthetic Transcripts	Jul 17, 2023	automatic-speech-translationImitation Learning	CodeCode Available
Domain Knowledge Distillation from Large Language Model: An Empirical Study in the Autonomous Driving Domain	Jul 17, 2023	Autonomous DrivingKnowledge Distillation	—Unverified
Cross-Lingual NER for Financial Transaction Data in Low-Resource Languages	Jul 16, 2023	Cross-Lingual NERKnowledge Distillation	—Unverified
MinT: Boosting Generalization in Mathematical Reasoning via Multi-View Fine-Tuning	Jul 16, 2023	Knowledge DistillationMathematical Reasoning	—Unverified
A Survey of Techniques for Optimizing Transformer Inference	Jul 16, 2023	Knowledge DistillationNeural Architecture Search	—Unverified
Intuitive Access to Smartphone Settings Using Relevance Model Trained by Contrastive Learning	Jul 15, 2023	Contrastive LearningKnowledge Distillation	—Unverified
SoccerKDNet: A Knowledge Distillation Framework for Action Recognition in Soccer Videos	Jul 15, 2023	Action RecognitionKnowledge Distillation	—Unverified
DreamTeacher: Pretraining Image Backbones with Deep Generative Models	Jul 14, 2023	Knowledge DistillationRepresentation Learning	—Unverified
Regression-Oriented Knowledge Distillation for Lightweight Ship Orientation Angle Prediction with Optical Remote Sensing Images	Jul 13, 2023	Knowledge DistillationPrediction	CodeCode Available
Frameless Graph Knowledge Distillation	Jul 13, 2023	Graph Representation LearningKnowledge Distillation	CodeCode Available
A metric learning approach for endoscopic kidney stone identification	Jul 13, 2023	Few-Shot LearningKnowledge Distillation	—Unverified
The Staged Knowledge Distillation in Video Classification: Harmonizing Student Progress by a Complementary Weakly Supervised Framework	Jul 11, 2023	Knowledge DistillationPseudo Label	—Unverified
Customizing Synthetic Data for Data-Free Student Learning	Jul 10, 2023	Data-free Knowledge DistillationKnowledge Distillation	CodeCode Available
Distilling Universal and Joint Knowledge for Cross-Domain Model Compression on Time Series Data	Jul 7, 2023	Knowledge DistillationModel Compression	CodeCode Available
On-Device Constrained Self-Supervised Speech Representation Learning for Keyword Spotting via Knowledge Distillation	Jul 6, 2023	Keyword SpottingKnowledge Distillation	—Unverified
Contextual Affinity Distillation for Image Anomaly Detection	Jul 6, 2023	Anomaly DetectionKnowledge Distillation	—Unverified
Distilling Missing Modality Knowledge from Ultrasound for Endometriosis Diagnosis with Magnetic Resonance Images	Jul 5, 2023	Knowledge Distillation	—Unverified
KDSTM: Neural Semi-supervised Topic Modeling with Knowledge Distillation	Jul 4, 2023	ClassificationKnowledge Distillation	—Unverified
Review helps learn better: Temporal Supervised Knowledge Distillation	Jul 3, 2023	image-classificationImage Classification	—Unverified
Shared Growth of Graph Neural Networks via Prompted Free-direction Knowledge Distillation	Jul 2, 2023	Knowledge DistillationPrompt Learning	—Unverified
Long-Tailed Continual Learning For Visual Food Recognition	Jul 1, 2023	Continual LearningData Augmentation	—Unverified
Streaming egocentric action anticipation: An evaluation scheme and approach	Jun 29, 2023	Action AnticipationKnowledge Distillation	—Unverified
Understanding the Overfitting of the Episodic Meta-training	Jun 29, 2023	Knowledge Distillation	—Unverified
A Dimensional Structure based Knowledge Distillation Method for Cross-Modal Learning	Jun 28, 2023	Knowledge Distillation	—Unverified
Exploring Dual Model Knowledge Distillation for Anomaly Detection	Jun 27, 2023	Anomaly Detectionfeature selection	—Unverified
Shoggoth: Towards Efficient Edge-Cloud Collaborative Real-Time Video Inference via Adaptive Online Learning	Jun 27, 2023	Knowledge Distillation	—Unverified
Reducing the gap between streaming and non-streaming Transducer-based ASR by adaptive two-stage knowledge distillation	Jun 27, 2023	Knowledge Distillationspeech-recognition	—Unverified
Accelerating Molecular Graph Neural Networks via Knowledge Distillation	Jun 26, 2023	Data AugmentationKnowledge Distillation	—Unverified

Show:10 25 50

← PrevPage 49 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified