Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1701–1750 of 4240 papers

Title	Date	Tasks	Status	Hype
REFT: Resource-Efficient Federated Training Framework for Heterogeneous and Resource-Constrained Environments	Aug 25, 2023	Federated Learningimage-classification	—Unverified	0
3D Face Alignment Through Fusion of Head Pose Information and Features	Aug 25, 2023	3D Face AlignmentFace Alignment	—Unverified	0
Self-Supervised Representation Learning with Cross-Context Learning between Global and Hypercolumn Features	Aug 25, 2023	Contrastive LearningKnowledge Distillation	—Unverified	0
Fall Detection using Knowledge Distillation Based Long short-term memory for Offline Embedded and Low Power Devices	Aug 24, 2023	Knowledge DistillationTime Series	—Unverified	0
Sentence Embedding Models for Ancient Greek Using Multilingual Knowledge Distillation	Aug 24, 2023	Authorship AttributionKnowledge Distillation	CodeCode Available	1
FedSOL: Stabilized Orthogonal Learning with Proximal Restrictions in Federated Learning	Aug 24, 2023	Continual LearningFederated Learning	CodeCode Available	1
Ground-to-Aerial Person Search: Benchmark Dataset and Approach	Aug 24, 2023	Knowledge DistillationPerson Search	CodeCode Available	1
DLIP: Distilling Language-Image Pre-training	Aug 24, 2023	Image CaptioningImage-text Retrieval	—Unverified	0
Multimodal Locally Enhanced Transformer for Continuous Sign Language Recognition	Aug 22, 2023	Knowledge DistillationPosition	—Unverified	0
Efficient Controllable Multi-Task Architectures	Aug 22, 2023	DecoderKnowledge Distillation	—Unverified	0
FedDAT: An Approach for Foundation Model Finetuning in Multi-Modal Heterogeneous Federated Learning	Aug 21, 2023	Federated LearningKnowledge Distillation	CodeCode Available	1
SpikingBERT: Distilling BERT to Train Spiking Language Models Using Implicit Differentiation	Aug 21, 2023	Knowledge DistillationLanguage Modelling	CodeCode Available	1
Representation Disparity-aware Distillation for 3D Object Detection	Aug 20, 2023	3D Object DetectionKnowledge Distillation	—Unverified	0
AltDiffusion: A Multilingual Text-to-Image Diffusion Model	Aug 19, 2023	BlockingConcept Alignment	CodeCode Available	1
LibreFace: An Open-Source Toolkit for Deep Facial Expression Analysis	Aug 18, 2023	Facial Expression RecognitionKnowledge Distillation	CodeCode Available	2
Unlimited Knowledge Distillation for Action Recognition in the Dark	Aug 18, 2023	Action RecognitionGPU	—Unverified	0
CCFace: Classification Consistency for Low-Resolution Face Recognition	Aug 18, 2023	ClassificationClassification Consistency	—Unverified	0
Adapt Your Teacher: Improving Knowledge Distillation for Exemplar-free Continual Learning	Aug 18, 2023	class-incremental learningClass Incremental Learning	CodeCode Available	1
Learning Lightweight Object Detectors via Multi-Teacher Progressive Distillation	Aug 17, 2023	Edge-computingInstance Segmentation	—Unverified	0
Learning Through Guidance: Knowledge Distillation for Endoscopic Image Classification	Aug 17, 2023	ClassificationFeature Engineering	—Unverified	0
SkinDistilViT: Lightweight Vision Transformer for Skin Lesion Classification	Aug 16, 2023	Cancer ClassificationClassification	CodeCode Available	0
Radio2Text: Streaming Speech Recognition Using mmWave Radio Signals	Aug 16, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Distilling Knowledge from Resource Management Algorithms to Neural Networks: A Unified Training Assistance Approach	Aug 15, 2023	Knowledge DistillationManagement	—Unverified	0
A Survey on Model Compression for Large Language Models	Aug 15, 2023	BenchmarkingKnowledge Distillation	—Unverified	0
Token-Scaled Logit Distillation for Ternary Weight Generative Language Models	Aug 13, 2023	Arithmetic ReasoningCommon Sense Reasoning	CodeCode Available	1
Multi-Label Knowledge Distillation	Aug 12, 2023	Binary ClassificationKnowledge Distillation	CodeCode Available	1
Continual Face Forgery Detection via Historical Distribution Preserving	Aug 11, 2023	Knowledge Distillation	—Unverified	0
Complex Facial Expression Recognition Using Deep Knowledge Distillation of Basic Features	Aug 11, 2023	Continual LearningEmotion Recognition	CodeCode Available	0
Towards General and Fast Video Derain via Knowledge Distillation	Aug 10, 2023	DecoderKnowledge Distillation	—Unverified	0
FPGA Resource-aware Structured Pruning for Real-Time Neural Networks	Aug 9, 2023	Classificationimage-classification	—Unverified	0
Sci-CoT: Leveraging Large Language Models for Enhanced Knowledge Distillation in Small Models for Scientific QA	Aug 9, 2023	ARCKnowledge Distillation	—Unverified	0
Multi-View Fusion and Distillation for Subgrade Distresses Detection based on 3D-GPR	Aug 9, 2023	GPRKnowledge Distillation	CodeCode Available	1
AICSD: Adaptive Inter-Class Similarity Distillation for Semantic Segmentation	Aug 8, 2023	Knowledge DistillationSemantic Segmentation	CodeCode Available	1
ConDistFL: Conditional Distillation for Federated Learning from Partially Annotated Data	Aug 8, 2023	Federated LearningKnowledge Distillation	CodeCode Available	2
Enhancing Adversarial Robustness in Low-Label Regime via Adaptively Weighted Regularization and Knowledge Distillation	Aug 8, 2023	Adversarial RobustnessKnowledge Distillation	CodeCode Available	0
Teacher-Student Architecture for Knowledge Distillation: A Survey	Aug 8, 2023	Knowledge Distillationregression	—Unverified	0
Adapter-based Selective Knowledge Distillation for Federated Multi-domain Meeting Summarization	Aug 7, 2023	Federated LearningKnowledge Distillation	—Unverified	0
Efficient Temporal Sentence Grounding in Videos with Multi-Teacher Knowledge Distillation	Aug 7, 2023	Knowledge DistillationSentence	CodeCode Available	0
Few-shot Class-Incremental Semantic Segmentation via Pseudo-Labeling and Knowledge Distillation	Aug 5, 2023	Class-Incremental Semantic SegmentationKnowledge Distillation	CodeCode Available	0
One-stage Low-resolution Text Recognition with High-resolution Knowledge Transfer	Aug 5, 2023	Contrastive LearningKnowledge Distillation	CodeCode Available	1
Transferable Graph Structure Learning for Graph-based Traffic Forecasting Across Cities	Aug 4, 2023	Graph structure learningKnowledge Distillation	CodeCode Available	1
Scene-aware Human Pose Generation using Transformer	Aug 4, 2023	Knowledge DistillationScene Understanding	—Unverified	0
VQGraph: Rethinking Graph Representation Space for Bridging GNNs and MLPs	Aug 4, 2023	Knowledge DistillationQuantization	CodeCode Available	1
Class Incremental Learning with Self-Supervised Pre-Training and Prototype Learning	Aug 4, 2023	class-incremental learningClass Incremental Learning	—Unverified	0
Eyelid’s Intrinsic Motion-aware Feature Learning for Real-time Eyeblink Detection in the Wild	Aug 3, 2023	AttributeDescriptive	CodeCode Available	0
Baby Llama: knowledge distillation from an ensemble of teachers trained on a small dataset with no performance penalty	Aug 3, 2023	Knowledge Distillation	CodeCode Available	1
Improved Knowledge Distillation for Crowd Counting on IoT Device	Aug 2, 2023	Crowd CountingKnowledge Distillation	CodeCode Available	0
A vision transformer-based framework for knowledge transfer from multi-modal to mono-modal lymphoma subtyping models	Aug 2, 2023	Knowledge DistillationTransfer Learning	—Unverified	0
Spatio-Temporal Branching for Motion Prediction using Motion Increments	Aug 2, 2023	Human motion predictionKnowledge Distillation	CodeCode Available	0
Towards Better Query Classification with Multi-Expert Knowledge Condensation in JD Ads Search	Aug 2, 2023	Knowledge Distillation	—Unverified	0

Show:10 25 50

← PrevPage 35 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified