Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 751–800 of 4240 papers

Title	Date	Tasks	Status	Hype
Joint Input and Output Coordination for Class-Incremental Learning	Sep 9, 2024	class-incremental learningClass Incremental Learning	—Unverified	0
LEROjD: Lidar Extended Radar-Only Object Detection	Sep 9, 2024	3D Object DetectionKnowledge Distillation	CodeCode Available	1
LoCa: Logit Calibration for Knowledge Distillation	Sep 7, 2024	image-classificationImage Classification	—Unverified	0
SCARF: Scalable Continual Learning Framework for Memory-efficient Multiple Neural Radiance Fields	Sep 6, 2024	Continual LearningKnowledge Distillation	—Unverified	0
Experimentation in Content Moderation using RWKV	Sep 5, 2024	CPUKnowledge Distillation	—Unverified	0
DKDM: Data-Free Knowledge Distillation for Diffusion Models with Any Architecture	Sep 5, 2024	Data-free Knowledge DistillationDenoising	CodeCode Available	1
Data-free Distillation with Degradation-prompt Diffusion for Multi-weather Image Restoration	Sep 5, 2024	Image RestorationKnowledge Distillation	—Unverified	0
Sorbet: A Neuromorphic Hardware-Compatible Transformer-Based Spiking Language Model	Sep 4, 2024	Knowledge DistillationLanguage Modeling	—Unverified	0
Efficient Image Compression Using Advanced State Space Models	Sep 4, 2024	Computational EfficiencyImage Compression	—Unverified	0
Non-target Divergence Hypothesis: Toward Understanding Domain Gaps in Cross-Modal Knowledge Distillation	Sep 4, 2024	Knowledge Distillation	—Unverified	0
Collaborative Learning for Enhanced Unsupervised Domain Adaptation	Sep 4, 2024	Domain AdaptationKnowledge Distillation	—Unverified	0
Low-Resolution Object Recognition with Cross-Resolution Relational Contrastive Distillation	Sep 4, 2024	Face RecognitionKnowledge Distillation	—Unverified	0
Designing Large Foundation Models for Efficient Training and Inference: A Survey	Sep 3, 2024	Knowledge DistillationModel Compression	CodeCode Available	1
Efficient Point Cloud Classification via Offline Distillation Framework and Negative-Weight Self-Distillation Technique	Sep 3, 2024	Data AugmentationKnowledge Distillation	—Unverified	0
Improving Apple Object Detection with Occlusion-Enhanced Distillation	Sep 3, 2024	Knowledge DistillationObject	—Unverified	0
Adaptive Explicit Knowledge Transfer for Knowledge Distillation	Sep 3, 2024	Knowledge DistillationTransfer Learning	—Unverified	0
Low-Resolution Face Recognition via Adaptable Instance-Relation Distillation	Sep 3, 2024	Face RecognitionKnowledge Distillation	—Unverified	0
Compressing VAE-Based Out-of-Distribution Detectors for Embedded Deployment	Sep 2, 2024	CPUGPU	—Unverified	0
MobileIQA: Exploiting Mobile-level Diverse Opinion Network For No-Reference Image Quality Assessment Using Knowledge Distillation	Sep 2, 2024	Computational EfficiencyImage Quality Assessment	CodeCode Available	1
Diffusion-Driven Data Replay: A Novel Approach to Combat Forgetting in Federated Class Continual Learning	Sep 2, 2024	Continual LearningContrastive Learning	CodeCode Available	1
MedDet: Generative Adversarial Distillation for Efficient Cervical Disc Herniation Detection	Aug 30, 2024	Knowledge DistillationModel Compression	CodeCode Available	0
HiTSR: A Hierarchical Transformer for Reference-based Super-Resolution	Aug 30, 2024	Image Super-ResolutionKnowledge Distillation	CodeCode Available	0
How Knowledge Distillation Mitigates the Synthetic Gap in Fair Face Recognition	Aug 30, 2024	Face RecognitionFairness	CodeCode Available	0
VLM-KD: Knowledge Distillation from VLM for Long-Tail Visual Recognition	Aug 29, 2024	Knowledge DistillationLanguage Modeling	—Unverified	0
Smaller, Weaker, Yet Better: Training LLM Reasoners via Compute-Optimal Sampling	Aug 29, 2024	DiversityKnowledge Distillation	—Unverified	0
MST-KD: Multiple Specialized Teachers Knowledge Distillation for Fair Face Recognition	Aug 29, 2024	Face RecognitionKnowledge Distillation	CodeCode Available	0
Boosting Lossless Speculative Decoding via Feature Sampling and Partial Alignment Distillation	Aug 28, 2024	Knowledge DistillationLanguage Modelling	—Unverified	0
ModalityMirror: Improving Audio Classification in Modality Heterogeneity Federated Learning with Multimodal Distillation	Aug 28, 2024	Audio ClassificationFederated Learning	—Unverified	0
LLaVA-MoD: Making LLaVA Tiny via MoE Knowledge Distillation	Aug 28, 2024	Computational EfficiencyHallucination	CodeCode Available	3
Online pre-training with long-form videos	Aug 28, 2024	Action RecognitionContrastive Learning	—Unverified	0
On-Device Language Models: A Comprehensive Review	Aug 26, 2024	Knowledge DistillationQuantization	CodeCode Available	0
Bridging the Gap: Unpacking the Hidden Challenges in Knowledge Distillation for Online Ranking Systems	Aug 26, 2024	Knowledge DistillationRecommendation Systems	—Unverified	0
GenFormer -- Generated Images are All You Need to Improve Robustness of Transformers on Small Datasets	Aug 26, 2024	AllData Augmentation	CodeCode Available	1
TSAK: Two-Stage Semantic-Aware Knowledge Distillation for Efficient Wearable Modality and Model Optimization in Manufacturing Lines	Aug 26, 2024	Activity RecognitionHuman Activity Recognition	—Unverified	0
Let Video Teaches You More: Video-to-Image Knowledge Distillation using DEtection TRansformer for Medical Video Lesion Detection	Aug 26, 2024	Knowledge DistillationLesion Detection	—Unverified	0
Bring the Power of Diffusion Model to Defect Detection	Aug 25, 2024	Defect DetectionDenoising	—Unverified	0
Condensed Sample-Guided Model Inversion for Knowledge Distillation	Aug 25, 2024	Knowledge Distillationmodel	—Unverified	0
Growing Deep Neural Network Considering with Similarity between Neurons	Aug 23, 2024	Decision MakingKnowledge Distillation	—Unverified	0
Foundational Model for Electron Micrograph Analysis: Instruction-Tuning Small-Scale Language-and-Vision Assistant for Enterprise Adoption	Aug 23, 2024	Instruction FollowingKnowledge Distillation	—Unverified	0
Rebalancing Multi-Label Class-Incremental Learning	Aug 22, 2024	class-incremental learningClass Incremental Learning	—Unverified	0
Aligning (Medical) LLMs for (Counterfactual) Fairness	Aug 22, 2024	counterfactualFairness	CodeCode Available	0
Vision-Based Detection of Uncooperative Targets and Components on Small Satellites	Aug 22, 2024	Knowledge Distillation	—Unverified	0
Interactive DualChecker for Mitigating Hallucinations in Distilling Large Language Models	Aug 22, 2024	In-Context LearningKnowledge Distillation	—Unverified	0
A Unified Framework for Continual Learning and Unlearning	Aug 21, 2024	Continual LearningKnowledge Distillation	—Unverified	0
LAKD-Activation Mapping Distillation Based on Local Learning	Aug 21, 2024	Knowledge Distillation	—Unverified	0
Domain-invariant Progressive Knowledge Distillation for UAV-based Object Detection	Aug 21, 2024	Knowledge DistillationObject	—Unverified	0
SAM-COD: SAM-guided Unified Framework for Weakly-Supervised Camouflaged Object Detection	Aug 20, 2024	Knowledge Distillationobject-detection	—Unverified	0
Adaptive Knowledge Distillation for Classification of Hand Images using Explainable Vision Transformers	Aug 20, 2024	Knowledge Distillation	—Unverified	0
Generating Synthetic Fair Syntax-agnostic Data by Learning and Distilling Fair Representation	Aug 20, 2024	FairnessKnowledge Distillation	—Unverified	0
OVOSE: Open-Vocabulary Semantic Segmentation in Event-Based Cameras	Aug 18, 2024	Autonomous DrivingDomain Adaptation	CodeCode Available	0

Show:10 25 50

← PrevPage 16 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified