Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 201–250 of 4240 papers

Title	Date	Tasks	Status	Hype
KD^2M: An unifying framework for feature knowledge distillation	Apr 2, 2025	Knowledge Distillation	—Unverified	0
Style over Substance: Distilled Language Models Reason Via Stylistic Replication	Apr 2, 2025	Knowledge Distillation	—Unverified	0
A Novel Approach To Implementing Knowledge Distillation In Tsetlin Machines	Apr 2, 2025	Knowledge Distillationtext-classification	—Unverified	0
OccludeNeRF: Geometric-aware 3D Scene Inpainting with Collaborative Score Distillation in NeRF	Apr 1, 2025	DenoisingKnowledge Distillation	—Unverified	0
Global Intervention and Distillation for Federated Out-of-Distribution Generalization	Apr 1, 2025	AttributeData Augmentation	—Unverified	0
Adversarial Curriculum Graph-Free Knowledge Distillation for Graph Neural Networks	Apr 1, 2025	Data-free Knowledge DistillationKnowledge Distillation	—Unverified	0
Is LLM the Silver Bullet to Low-Resource Languages Machine Translation?	Mar 31, 2025	ArticlesKnowledge Distillation	—Unverified	0
Unimodal-driven Distillation in Multimodal Emotion Recognition with Dynamic Fusion	Mar 31, 2025	Emotion RecognitionKnowledge Distillation	—Unverified	0
Crossmodal Knowledge Distillation with WordNet-Relaxed Text Embeddings for Robust Image Classification	Mar 31, 2025	image-classificationImage Classification	—Unverified	0
A Plasticity-Aware Method for Continual Self-Supervised Learning in Remote Sensing	Mar 31, 2025	Continual Self-Supervised LearningKnowledge Distillation	—Unverified	0
Multi-modal Knowledge Distillation-based Human Trajectory Forecasting	Mar 28, 2025	Autonomous DrivingKnowledge Distillation	CodeCode Available	1
Efficient Verified Machine Unlearning For Distillation	Mar 28, 2025	Knowledge DistillationMachine Unlearning	—Unverified	0
Intrinsic Image Decomposition for Robust Self-supervised Monocular Depth Estimation on Reflective Surfaces	Mar 28, 2025	Depth EstimationDepth Prediction	—Unverified	0
Delving Deep into Semantic Relation Distillation	Mar 27, 2025	Knowledge DistillationModel Compression	—Unverified	0
Alleviating LLM-based Generative Retrieval Hallucination in Alipay Search	Mar 27, 2025	HallucinationKnowledge Distillation	—Unverified	0
DuckSegmentation: A segmentation model based on the AnYue Hemp Duck Dataset	Mar 27, 2025	Knowledge DistillationObject Recognition	—Unverified	0
Small Object Detection: A Comprehensive Survey on Challenges, Techniques and Real-World Applications	Mar 26, 2025	ArticlesData Augmentation	—Unverified	0
MoLe-VLA: Dynamic Layer-skipping Vision Language Action Model via Mixture-of-Layers for Efficient Robot Manipulation	Mar 26, 2025	Knowledge DistillationMixture-of-Experts	—Unverified	0
Modality-Independent Brain Lesion Segmentation with Privacy-aware Continual Learning	Mar 26, 2025	Continual LearningKnowledge Distillation	CodeCode Available	0
Scaling Down Text Encoders of Text-to-Image Diffusion Models	Mar 25, 2025	GPUImage Generation	CodeCode Available	2
Plug-and-Play Interpretable Responsible Text-to-Image Generation via Dual-Space Multi-facet Concept Control	Mar 24, 2025	Image GenerationKnowledge Distillation	—Unverified	0
Distilling Stereo Networks for Performant and Efficient Leaner Networks	Mar 24, 2025	General KnowledgeKnowledge Distillation	CodeCode Available	0
FedSKD: Aggregation-free Model-heterogeneous Federated Learning using Multi-dimensional Similarity Knowledge Distillation	Mar 23, 2025	Federated LearningKnowledge Distillation	—Unverified	0
CustomKD: Customizing Large Vision Foundation for Edge Model Improvement via Knowledge Distillation	Mar 23, 2025	Domain AdaptationKnowledge Distillation	—Unverified	0
OmniScience: A Domain-Specialized LLM for Scientific Reasoning and Discovery	Mar 22, 2025	Knowledge Distillation	—Unverified	0
Efficient Intent-Based Filtering for Multi-Party Conversations Using Knowledge Distillation from LLMs	Mar 21, 2025	intent-classificationIntent Classification	—Unverified	0
Improving Acoustic Scene Classification with City Features	Mar 21, 2025	Acoustic Scene ClassificationClassification	—Unverified	0
Efficient Knowledge Distillation via Curriculum Extraction	Mar 21, 2025	Knowledge DistillationLanguage Modeling	—Unverified	0
InhibiDistilbert: Knowledge Distillation for a ReLU and Addition-based Transformer	Mar 20, 2025	Knowledge DistillationModel Compression	—Unverified	0
Advancing Deep Learning through Probability Engineering: A Pragmatic Paradigm for Modern AI	Mar 19, 2025	Deep LearningFederated Learning	—Unverified	0
DCA: Dividing and Conquering Amnesia in Incremental Object Detection	Mar 19, 2025	Knowledge Distillationobject-detection	CodeCode Available	0
Technical Report for the 5th CLVision Challenge at CVPR: Addressing the Class-Incremental with Repetition using Unlabeled Data -- 4th Place Solution	Mar 19, 2025	class-incremental learningClass Incremental Learning	CodeCode Available	0
KoGNER: A Novel Framework for Knowledge Graph Distillation on Biomedical Named Entity Recognition	Mar 19, 2025	Knowledge DistillationKnowledge Graphs	—Unverified	0
High Temporal Consistency through Semantic Similarity Propagation in Semi-Supervised Video Semantic Segmentation for Autonomous Flight	Mar 19, 2025	Image SegmentationKnowledge Distillation	CodeCode Available	1
Distilling 3D distinctive local descriptors for 6D pose estimation	Mar 19, 2025	6D Pose EstimationKnowledge Distillation	—Unverified	0
Ensemble Knowledge Distillation for Machine Learning Interatomic Potentials	Mar 18, 2025	Atomic ForcesKnowledge Distillation	—Unverified	0
Scale-Aware Contrastive Reverse Distillation for Unsupervised Medical Anomaly Detection	Mar 18, 2025	Anomaly DetectionKnowledge Distillation	CodeCode Available	0
SCJD: Sparse Correlation and Joint Distillation for Efficient 3D Human Pose Estimation	Mar 18, 2025	3D Human Pose EstimationKnowledge Distillation	CodeCode Available	0
Uncertainty-Aware Knowledge Distillation for Compact and Efficient 6DoF Pose Estimation	Mar 17, 2025	Autonomous NavigationKnowledge Distillation	—Unverified	0
Real-Time Cell Sorting with Scalable In Situ FPGA-Accelerated Deep Learning	Mar 16, 2025	Cell DetectionClassification	CodeCode Available	0
A Comprehensive Survey on Knowledge Distillation	Mar 15, 2025	Knowledge DistillationSurvey	CodeCode Available	2
Enabling Weak Client Participation via On-device Knowledge Distillation in Heterogenous Federated Learning	Mar 14, 2025	Federated LearningKnowledge Distillation	—Unverified	0
Exploring Performance-Complexity Trade-Offs in Sound Event Detection Models	Mar 14, 2025	Audio TaggingEvent Detection	CodeCode Available	1
Creating a Good Teacher for Knowledge Distillation in Acoustic Scene Classification	Mar 14, 2025	Acoustic Scene ClassificationKnowledge Distillation	—Unverified	0
Adaptive Temperature Based on Logits Correlation in Knowledge Distillation	Mar 12, 2025	Knowledge Distillation	CodeCode Available	0
CleverDistiller: Simple and Spatially Consistent Cross-modal Distillation	Mar 12, 2025	3D Object DetectionAutonomous Driving	—Unverified	0
xVLM2Vec: Adapting LVLM-based embedding models to multilinguality using Self-Knowledge Distillation	Mar 12, 2025	Knowledge DistillationLanguage Modeling	—Unverified	0
Vi-LAD: Vision-Language Attention Distillation for Socially-Aware Robot Navigation in Dynamic Environments	Mar 12, 2025	Knowledge DistillationMotion Planning	—Unverified	0
Unified Locomotion Transformer with Simultaneous Sim-to-Real Transfer for Quadrupeds	Mar 12, 2025	Deep Reinforcement LearningKnowledge Distillation	—Unverified	0
LightGen: Efficient Image Generation through Knowledge Distillation and Direct Preference Optimization	Mar 11, 2025	GPUImage Generation	CodeCode Available	2

Show:10 25 50

← PrevPage 5 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified