Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2101–2150 of 4240 papers

Title	Date	Tasks	Status
Semi-UFormer: Semi-supervised Uncertainty-aware Transformer for Image Dehazing	Oct 28, 2022	Image DehazingKnowledge Distillation	—Unverified
Sentence Embeddings by Ensemble Distillation	Apr 14, 2021	Knowledge DistillationSemantic Textual Similarity	—Unverified
Sentence-Level or Token-Level? A Comprehensive Study on Knowledge Distillation	Apr 23, 2024	Knowledge DistillationMachine Translation	—Unverified
Sentiment Interpretable Logic Tensor Network for Aspect-Term Sentiment Analysis	Oct 1, 2022	Computational EfficiencyKnowledge Distillation	—Unverified
SepALM: Audio Language Models Are Error Correctors for Robust Speech Separation	May 6, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Separating Novel Features for Logical Anomaly Detection: A Straightforward yet Effective Approach	Jul 25, 2024	Anomaly DetectionKnowledge Distillation	—Unverified
SeqPATE: Differentially Private Text Generation via Knowledge Distillation	Sep 29, 2021	Knowledge DistillationSentence	—Unverified
Sequence-Level Knowledge Distillation for Model Compression of Attention-based Sequence-to-Sequence Speech Recognition	Nov 12, 2018	Knowledge DistillationModel Compression	—Unverified
Sequence-Level Knowledge Distillation for Class-Incremental End-to-End Spoken Language Understanding	May 23, 2023	Continual LearningDecoder	—Unverified
Sequential Editing for Lifelong Training of Speech Recognition Models	Jun 25, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sewer Image Super-Resolution with Depth Priors and Its Lightweight Network	Jul 27, 2024	Computational EfficiencyImage Super-Resolution	—Unverified
SFedKD: Sequential Federated Learning with Discrepancy-Aware Multi-Teacher Knowledge Distillation	Jul 11, 2025	Federated LearningKnowledge Distillation	—Unverified
Shape-Net: Room Layout Estimation from Panoramic Images Robust to Occlusion using Knowledge Distillation with 3D Shapes as Additional Inputs	Apr 25, 2023	3D geometry3D Reconstruction	—Unverified
Shared Growth of Graph Neural Networks via Prompted Free-direction Knowledge Distillation	Jul 2, 2023	Knowledge DistillationPrompt Learning	—Unverified
Shoggoth: Towards Efficient Edge-Cloud Collaborative Real-Time Video Inference via Adaptive Online Learning	Jun 27, 2023	Knowledge Distillation	—Unverified
Siamese Sleep Transformer For Robust Sleep Stage Scoring With Self-knowledge Distillation and Selective Batch Sampling	Dec 12, 2022	Knowledge DistillationSelf-Knowledge Distillation	—Unverified
SIGN: Spatial-information Incorporated Generative Network for Generalized Zero-shot Semantic Segmentation	Aug 27, 2021	Knowledge DistillationSegmentation	—Unverified
Similarity of Neural Architectures using Adversarial Attack Transferability	Oct 20, 2022	Adversarial AttackDiversity	—Unverified
Similarity-Preserving Knowledge Distillation	Jul 23, 2019	Knowledge DistillationNeural Network Compression	—Unverified
Similarity Transfer for Knowledge Distillation	Mar 18, 2021	Knowledge Distillation	—Unverified
Simple Regularisation for Uncertainty-Aware Knowledge Distillation	May 19, 2022	BIG-bench Machine LearningDiversity	—Unverified
Simple Unsupervised Knowledge Distillation With Space Similarity	Sep 20, 2024	Knowledge DistillationSelf-Supervised Learning	—Unverified
Simplification Is All You Need against Out-of-Distribution Overconfidence	Jan 1, 2025	AllAttribute	—Unverified
Simplifying CLIP: Unleashing the Power of Large-Scale Models on Consumer-level Computers	Nov 22, 2024	Data AugmentationGPU	—Unverified
Sim-to-Real Transfer in Deep Reinforcement Learning for Robotics: a Survey	Sep 24, 2020	Deep Reinforcement LearningDomain Adaptation	—Unverified
SimulSpeech: End-to-End Simultaneous Speech to Text Translation	Jul 1, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Simultaneous Reward Distillation and Preference Learning: Get You a Language Model Who Can Do Both	Oct 11, 2024	Knowledge DistillationLanguage Modeling	—Unverified
Single image calibration using knowledge distillation approaches	Dec 5, 2022	Camera CalibrationIncremental Learning	—Unverified
Single Snapshot Distillation for Phase Coded Mask Design in Phase Retrieval	May 23, 2025	global-optimizationKnowledge Distillation	—Unverified
Single-stage TTS with Masked Audio Token Modeling and Semantic Knowledge Distillation	Sep 17, 2024	Knowledge DistillationSpeech Synthesis	—Unverified
SKDBERT: Compressing BERT via Stochastic Knowledge Distillation	Nov 26, 2022	Knowledge DistillationLanguage Modeling	—Unverified
Sketch Down the FLOPs: Towards Efficient Networks for Human Sketch	May 29, 2025	Image RetrievalKnowledge Distillation	—Unverified
SKILL: Similarity-aware Knowledge distILLation for Speech Self-Supervised Learning	Feb 26, 2024	Knowledge DistillationSelf-Supervised Learning	—Unverified
SLaM: Student-Label Mixing for Distillation with Unlabeled Examples	Feb 8, 2023	Knowledge Distillation	—Unverified
SlimSeg: Slimmable Semantic Segmentation with Boundary Supervision	Jul 13, 2022	Knowledge DistillationSegmentation	—Unverified
Smaller, Weaker, Yet Better: Training LLM Reasoners via Compute-Optimal Sampling	Aug 29, 2024	DiversityKnowledge Distillation	—Unverified
Small Language Models are Equation Reasoners	Sep 19, 2024	Arithmetic ReasoningKnowledge Distillation	—Unverified
Small Object Detection: A Comprehensive Survey on Challenges, Techniques and Real-World Applications	Mar 26, 2025	ArticlesData Augmentation	—Unverified
Small Vision-Language Models: A Survey on Compact Architectures and Techniques	Mar 9, 2025	Computational EfficiencyKnowledge Distillation	—Unverified
Smart Inference for Multidigit Convolutional Neural Network based Barcode Decoding	Apr 14, 2020	Knowledge Distillation	—Unverified
SMOC-Net: Leveraging Camera Pose for Self-Supervised Monocular Object Pose Estimation	Jan 1, 2023	6D Pose Estimation using RGBKnowledge Distillation	—Unverified
Smoothing Out Hallucinations: Mitigating LLM Hallucination with Smoothed Knowledge Distillation	Feb 16, 2025	HallucinationKnowledge Distillation	—Unverified
SnapGen: Taming High-Resolution Text-to-Image Models for Mobile Devices with Efficient Architectures and Training	Dec 12, 2024	Knowledge DistillationText-to-Image Generation	—Unverified
SNN-PAR: Energy Efficient Pedestrian Attribute Recognition via Spiking Neural Networks	Oct 10, 2024	AttributeKnowledge Distillation	—Unverified
SoccerKDNet: A Knowledge Distillation Framework for Action Recognition in Soccer Videos	Jul 15, 2023	Action RecognitionKnowledge Distillation	—Unverified
Soft Knowledge Distillation with Multi-Dimensional Cross-Net Attention for Image Restoration Models Compression	Jan 16, 2025	Contrastive LearningDeblurring	—Unverified
Soft Prompt Decoding for Multilingual Dense Retrieval	May 15, 2023	Cross-Lingual Information RetrievalInformation Retrieval	—Unverified
Solvable Model for Inheriting the Regularization through Knowledge Distillation	Dec 1, 2020	Knowledge DistillationTransfer Learning	—Unverified
SonoSAMTrack -- Segment and Track Anything on Ultrasound Images	Oct 25, 2023	Knowledge Distillation	—Unverified
Sorbet: A Neuromorphic Hardware-Compatible Transformer-Based Spiking Language Model	Sep 4, 2024	Knowledge DistillationLanguage Modeling	—Unverified

Show:10 25 50

← PrevPage 43 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified