Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1001–1050 of 4240 papers

Title	Date	Tasks	Status	Hype
IOR: Inversed Objects Replay for Incremental Object Detection	Jun 7, 2024	Knowledge DistillationObject	—Unverified	0
To Distill or Not to Distill? On the Robustness of Robust Knowledge Distillation	Jun 6, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
LenslessFace: An End-to-End Optimized Lensless System for Privacy-Preserving Face Verification	Jun 6, 2024	Face DetectionFace Verification	CodeCode Available	1
Step Out and Seek Around: On Warm-Start Training with Incremental Data	Jun 6, 2024	Autonomous DrivingKnowledge Distillation	—Unverified	0
Mutual Information Guided Backdoor Mitigation for Pre-trained Encoders	Jun 5, 2024	Knowledge DistillationSelf-Supervised Learning	—Unverified	0
Decision Boundary-aware Knowledge Consolidation Generates Better Instance-Incremental Learner	Jun 5, 2024	class-incremental learningClass Incremental Learning	—Unverified	0
Tiny models from tiny data: Textual and null-text inversion for few-shot distillation	Jun 5, 2024	Few-Shot Image Classificationimage-classification	CodeCode Available	0
PLaD: Preference-based Large Language Model Distillation with Pseudo-Preference Pairs	Jun 5, 2024	Knowledge DistillationLanguage Modeling	—Unverified	0
Adversarial Moment-Matching Distillation of Large Language Models	Jun 5, 2024	Imitation LearningInstruction Following	CodeCode Available	0
Multi-Task Multi-Scale Contrastive Knowledge Distillation for Efficient Medical Image Segmentation	Jun 5, 2024	Contrastive LearningImage Segmentation	CodeCode Available	1
Optimal Transport Guided Correlation Assignment for Multimodal Entity Linking	Jun 4, 2024	Entity LinkingKnowledge Distillation	CodeCode Available	0
RKLD: Reverse KL-Divergence-based Knowledge Distillation for Unlearning Personal Information in Large Language Models	Jun 4, 2024	Knowledge DistillationLanguage Modeling	—Unverified	0
DL-KDD: Dual-Light Knowledge Distillation for Action Recognition in the Dark	Jun 4, 2024	Action RecognitionKnowledge Distillation	—Unverified	0
Toward Efficient Deep Spiking Neuron Networks:A Survey On Compression	Jun 3, 2024	Knowledge DistillationQuantization	—Unverified	0
Decoupled Alignment for Robust Plug-and-Play Adaptation	Jun 3, 2024	Knowledge Distillation	—Unverified	0
Robust Knowledge Distillation Based on Feature Variance Against Backdoored Teacher Model	Jun 1, 2024	Knowledge DistillationModel Compression	CodeCode Available	0
Learning Background Prompts to Discover Implicit Knowledge for Open Vocabulary Object Detection	Jun 1, 2024	Knowledge DistillationObject	—Unverified	0
Multi-label Class Incremental Emotion Decoding with Augmented Emotional Semantics Learning	May 31, 2024	class-incremental learningClass Incremental Learning	—Unverified	0
Vision-Language Meets the Skeleton: Progressively Distillation with Cross-Modal Knowledge for 3D Action Representation Learning	May 31, 2024	Action RecognitionContrastive Learning	CodeCode Available	0
Adv-KD: Adversarial Knowledge Distillation for Faster Diffusion Sampling	May 31, 2024	DenoisingImage Generation	CodeCode Available	0
GKT: A Novel Guidance-Based Knowledge Transfer Framework For Efficient Cloud-edge Collaboration LLM Deployment	May 30, 2024	GSM8KKnowledge Distillation	CodeCode Available	0
Distribution Aligned Semantics Adaption for Lifelong Person Re-Identification	May 30, 2024	Knowledge DistillationPerson Re-Identification	CodeCode Available	0
Scalable Detection of Salient Entities in News Articles	May 30, 2024	ArticlesKnowledge Distillation	—Unverified	0
Relation Modeling and Distillation for Learning with Noisy Labels	May 30, 2024	Contrastive LearningKnowledge Distillation	—Unverified	0
Improving the Training of Rectified Flows	May 30, 2024	Image GenerationKnowledge Distillation	CodeCode Available	2
Estimating Human Poses Across Datasets: A Unified Skeleton and Multi-Teacher Distillation Approach	May 30, 2024	Activity RecognitionKnowledge Distillation	—Unverified	0
WebUOT-1M: Advancing Deep Underwater Object Tracking with A Million-Scale Benchmark	May 30, 2024	Knowledge DistillationObject Tracking	—Unverified	0
BLSP-KD: Bootstrapping Language-Speech Pre-training via Knowledge Distillation	May 29, 2024	Instruction FollowingKnowledge Distillation	—Unverified	0
Forward-Backward Knowledge Distillation for Continual Clustering	May 29, 2024	ClusteringContinual Learning	—Unverified	0
Continual Collaborative Distillation for Recommender System	May 29, 2024	Knowledge DistillationRecommendation Systems	CodeCode Available	1
Aligning in a Compact Space: Contrastive Knowledge Distillation between Heterogeneous Architectures	May 28, 2024	Contrastive LearningKnowledge Distillation	—Unverified	0
SLMRec: Distilling Large Language Models into Small for Sequential Recommendation	May 28, 2024	Knowledge DistillationLanguage Modeling	CodeCode Available	1
P4: Towards private, personalized, and Peer-to-Peer learning	May 27, 2024	Knowledge Distillation	—Unverified	0
TIMA: Text-Image Mutual Awareness for Balancing Zero-Shot Adversarial Robustness and Generalization Ability	May 27, 2024	Adversarial RobustnessKnowledge Distillation	—Unverified	0
LoReTrack: Efficient and Accurate Low-Resolution Transformer Tracking	May 27, 2024	CPUKnowledge Distillation	CodeCode Available	1
UniCompress: Enhancing Multi-Data Medical Image Compression with Knowledge Distillation	May 27, 2024	Image CompressionKnowledge Distillation	—Unverified	0
Noisy Data Meets Privacy: Training Local Models with Post-Processed Remote Queries	May 25, 2024	Knowledge DistillationModel extraction	—Unverified	0
Rethinking Early-Fusion Strategies for Improved Multispectral Object Detection	May 25, 2024	Knowledge DistillationMultispectral Object Detection	CodeCode Available	1
A Classifier-Free Incremental Learning Framework for Scalable Medical Image Segmentation	May 25, 2024	Contrastive LearningImage Segmentation	—Unverified	0
Harnessing Increased Client Participation with Cohort-Parallel Federated Learning	May 24, 2024	Federated Learningimage-classification	—Unverified	0
Leveraging knowledge distillation for partial multi-task learning from multiple remote sensing datasets	May 24, 2024	Knowledge DistillationMulti-Task Learning	CodeCode Available	0
3D Annotation-Free Learning by Distilling 2D Open-Vocabulary Segmentation Models for Autonomous Driving	May 24, 2024	Autonomous DrivingKnowledge Distillation	CodeCode Available	1
Pre-Trained Vision-Language Models as Partial Annotators	May 23, 2024	Contrastive Learningimage-classification	—Unverified	0
Recurrent Early Exits for Federated Learning with Heterogeneous Clients	May 23, 2024	Federated LearningKnowledge Distillation	CodeCode Available	1
JiuZhang3.0: Efficiently Improving Mathematical Reasoning by Training Small Data Synthesis Models	May 23, 2024	Knowledge DistillationMath	CodeCode Available	1
Awesome Multi-modal Object Tracking	May 23, 2024	Autonomous DrivingKnowledge Distillation	CodeCode Available	5
Efficient Multitask Dense Predictor via Binarization	May 23, 2024	BinarizationKnowledge Distillation	CodeCode Available	0
AdaGMLP: AdaBoosting GNN-to-MLP Knowledge Distillation	May 23, 2024	Knowledge Distillation	CodeCode Available	0
Data-Free Federated Class Incremental Learning with Diffusion-Based Generative Memory	May 22, 2024	class-incremental learningClass Incremental Learning	—Unverified	0
Joint Optimization of Streaming and Non-Streaming Automatic Speech Recognition with Multi-Decoder and Knowledge Distillation	May 22, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0

Show:10 25 50

← PrevPage 21 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified