Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2301–2350 of 4240 papers

Title	Date	Tasks	Status	Hype
LEAD: Liberal Feature-based Distillation for Dense Retrieval	Dec 10, 2022	Document RankingKnowledge Distillation	—Unverified	0
Complete-to-Partial 4D Distillation for Self-Supervised Point Cloud Sequence Representation Learning	Dec 10, 2022	Knowledge DistillationRepresentation Learning	—Unverified	0
Knowledge Distillation Applied to Optical Channel Equalization: Solving the Parallelization Problem of Recurrent Connection	Dec 8, 2022	Knowledge Distillation	—Unverified	0
Occlusion-Robust FAU Recognition by Mining Latent Space of Masked Autoencoders	Dec 8, 2022	Knowledge Distillation	—Unverified	0
Enhancing Low-Density EEG-Based Brain-Computer Interfaces with Similarity-Keeping Knowledge Distillation	Dec 6, 2022	EEGEeg Decoding	CodeCode Available	1
Life-long Learning for Multilingual Neural Machine Translation with Knowledge Distillation	Dec 6, 2022	Knowledge DistillationMachine Translation	—Unverified	0
Open World DETR: Transformer based Open World Object Detection	Dec 6, 2022	Knowledge DistillationObject	—Unverified	0
Leveraging Different Learning Styles for Improved Knowledge Distillation in Biomedical Imaging	Dec 6, 2022	Knowledge DistillationModel Compression	—Unverified	0
FedUKD: Federated UNet Model with Knowledge Distillation for Land Use Classification from Satellite and Street Views	Dec 5, 2022	Knowledge DistillationModel Compression	CodeCode Available	1
Single image calibration using knowledge distillation approaches	Dec 5, 2022	Camera CalibrationIncremental Learning	—Unverified	0
DA-CIL: Towards Domain Adaptive Class-Incremental 3D Object Detection	Dec 5, 2022	3D Object Detectionclass-incremental learning	—Unverified	0
The RoyalFlush System for the WMT 2022 Efficiency Task	Dec 3, 2022	DecoderGPU	—Unverified	0
Injecting Spatial Information for Monaural Speech Enhancement via Knowledge Distillation	Dec 2, 2022	Knowledge DistillationSpeech Enhancement	—Unverified	0
StructVPR: Distill Structural Knowledge with Weighting Samples for Visual Place Recognition	Dec 2, 2022	Image RetrievalKnowledge Distillation	—Unverified	0
Improving Simultaneous Machine Translation with Monolingual Data	Dec 2, 2022	HallucinationKnowledge Distillation	CodeCode Available	1
BEV-LGKD: A Unified LiDAR-Guided Knowledge Distillation Framework for BEV 3D Object Detection	Dec 1, 2022	3D Object DetectionAutonomous Driving	CodeCode Available	1
Distilling Reasoning Capabilities into Smaller Language Models	Dec 1, 2022	GSM8KKnowledge Distillation	CodeCode Available	0
Random Copolymer inverse design system orienting on Accurate discovering of Antimicrobial peptide-mimetic copolymers	Nov 30, 2022	Activity PredictionKnowledge Distillation	—Unverified	0
HEAT: Hardware-Efficient Automatic Tensor Decomposition for Transformer Compression	Nov 30, 2022	Efficient ExplorationKnowledge Distillation	—Unverified	0
Explicit Knowledge Transfer for Weakly-Supervised Code Generation	Nov 30, 2022	Code GenerationFew-Shot Learning	—Unverified	0
Hint-dynamic Knowledge Distillation	Nov 30, 2022	Knowledge Distillation	—Unverified	0
Attention-Based Depth Distillation with 3D-Aware Positional Encoding for Monocular 3D Object Detection	Nov 30, 2022	3D Object DetectionDepth Estimation	CodeCode Available	0
Coordinating Cross-modal Distillation for Molecular Property Prediction	Nov 30, 2022	Graph RegressionGraph Representation Learning	—Unverified	0
Knowledge Distillation based Degradation Estimation for Blind Super-Resolution	Nov 30, 2022	Blind Super-ResolutionImage Super-Resolution	CodeCode Available	1
Feature-domain Adaptive Contrastive Distillation for Efficient Single Image Super-Resolution	Nov 29, 2022	Image Super-ResolutionKnowledge Distillation	—Unverified	0
Curriculum Temperature for Knowledge Distillation	Nov 29, 2022	Image ClassificationKnowledge Distillation	CodeCode Available	1
SgVA-CLIP: Semantic-guided Visual Adapting of Vision-Language Models for Few-shot Image Classification	Nov 28, 2022	Few-Shot Image ClassificationFew-Shot Learning	CodeCode Available	0
BJTU-WeChat's Systems for the WMT22 Chat Translation Task	Nov 28, 2022	DenoisingKnowledge Distillation	—Unverified	0
Inter-KD: Intermediate Knowledge Distillation for CTC-Based Automatic Speech Recognition	Nov 28, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Lightning Fast Video Anomaly Detection via Adversarial Knowledge Distillation	Nov 28, 2022	Anomaly DetectionKnowledge Distillation	CodeCode Available	0
Dense Interspecies Face Embedding	Nov 28, 2022	Image ManipulationInterspecies Facial Keypoint Transfer	CodeCode Available	1
Class-aware Information for Logit-based Knowledge Distillation	Nov 27, 2022	Knowledge Distillation	—Unverified	0
Unbiased Knowledge Distillation for Recommendation	Nov 27, 2022	Knowledge DistillationModel Compression	CodeCode Available	1
EPIK: Eliminating multi-model Pipelines with Knowledge-distillation	Nov 27, 2022	Knowledge DistillationTransliteration	—Unverified	0
SKDBERT: Compressing BERT via Stochastic Knowledge Distillation	Nov 26, 2022	Knowledge DistillationLanguage Modeling	—Unverified	0
XKD: Cross-modal Knowledge Distillation with Domain Alignment for Video Representation Learning	Nov 25, 2022	Action ClassificationClassification	CodeCode Available	1
Look Around and Refer: 2D Synthetic Semantics Knowledge Distillation for 3D Visual Grounding	Nov 25, 2022	3D visual groundingKnowledge Distillation	CodeCode Available	1
MPCViT: Searching for Accurate and Efficient MPC-Friendly Vision Transformer with Heterogeneous Attention	Nov 25, 2022	Knowledge DistillationNeural Architecture Search	CodeCode Available	1
Distilling Knowledge from Self-Supervised Teacher by Embedding Graph Alignment	Nov 23, 2022	Knowledge DistillationRepresentation Learning	CodeCode Available	1
Structural Knowledge Distillation for Object Detection	Nov 23, 2022	Feature ImportanceKnowledge Distillation	—Unverified	0
Join the High Accuracy Club on ImageNet with A Binary Neural Network Ticket	Nov 23, 2022	Data AugmentationKnowledge Distillation	CodeCode Available	1
DGEKT: A Dual Graph Ensemble Learning Method for Knowledge Tracing	Nov 23, 2022	Ensemble LearningKnowledge Distillation	CodeCode Available	1
Backdoor Cleansing with Unlabeled Data	Nov 22, 2022	Knowledge Distillation	CodeCode Available	1
On the Transferability of Visual Features in Generalized Zero-Shot Learning	Nov 22, 2022	Generalized Zero-Shot LearningKnowledge Distillation	CodeCode Available	0
Blind Knowledge Distillation for Robust Image Classification	Nov 21, 2022	Classificationimage-classification	CodeCode Available	0
Privacy in Practice: Private COVID-19 Detection in X-Ray Images (Extended Version)	Nov 21, 2022	Knowledge DistillationMembership Inference Attack	CodeCode Available	0
Directed Acyclic Graph Factorization Machines for CTR Prediction via Knowledge Distillation	Nov 21, 2022	Click-Through Rate PredictionKnowledge Distillation	CodeCode Available	1
Multi-Level Knowledge Distillation for Out-of-Distribution Detection in Text	Nov 21, 2022	Knowledge DistillationLanguage Modeling	CodeCode Available	1
AI-KD: Adversarial learning and Implicit regularization for self-Knowledge Distillation	Nov 20, 2022	Knowledge DistillationSelf-Knowledge Distillation	—Unverified	0
Scalable Collaborative Learning via Representation Sharing	Nov 20, 2022	Federated LearningKnowledge Distillation	—Unverified	0

Show:10 25 50

← PrevPage 47 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified