Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3001–3050 of 4240 papers

Title	Date	Tasks	Status
Correlation-Decoupled Knowledge Distillation for Multimodal Sentiment Analysis with Incomplete Modalities	Apr 25, 2024	DisentanglementKnowledge Distillation	—Unverified
CORSD: Class-Oriented Relational Self Distillation	Apr 28, 2023	Knowledge DistillationModel Compression	—Unverified
Cosine Similarity Knowledge Distillation for Individual Class Information Transfer	Nov 24, 2023	Knowledge DistillationModel Compression	—Unverified
Cost-effective Deployment of BERT Models in Serverless Environment	Mar 19, 2021	Knowledge DistillationSemantic Textual Similarity	—Unverified
Cost-effective Deployment of BERT Models in Serverless Environment	Jun 1, 2021	Knowledge DistillationSemantic Textual Similarity	—Unverified
CoT2Align: Cross-Chain of Thought Distillation via Optimal Transport Alignment for Language Models with Different Tokenizers	Feb 24, 2025	Knowledge Distillation	—Unverified
CoT-Drive: Efficient Motion Forecasting for Autonomous Driving with LLMs and Chain-of-Thought Prompting	Mar 10, 2025	Autonomous DrivingKnowledge Distillation	—Unverified
Co-training and Co-distillation for Quality Improvement and Compression of Language Models	Nov 6, 2023	Data AugmentationKnowledge Distillation	—Unverified
Coupled End-to-End Transfer Learning With Generalized Fisher Information	Jun 1, 2018	DecoderDomain Adaptation	—Unverified
CoupleFace: Relation Matters for Face Recognition Distillation	Apr 12, 2022	Face RecognitionKnowledge Distillation	—Unverified
CourseGPT-zh: an Educational Large Language Model Based on Knowledge Distillation Incorporating Prompt Optimization	May 8, 2024	DiversityKnowledge Distillation	—Unverified
CovidCare: Transferring Knowledge from Existing EMR to Emerging Epidemic for Interpretable Prognosis	Jul 17, 2020	DiagnosticKnowledge Distillation	—Unverified
Creating a Good Teacher for Knowledge Distillation in Acoustic Scene Classification	Mar 14, 2025	Acoustic Scene ClassificationKnowledge Distillation	—Unverified
Creating Lightweight Object Detectors with Model Compression for Deployment on Edge Devices	May 6, 2019	Knowledge DistillationModel Compression	—Unverified
CREFT: Sequential Multi-Agent LLM for Character Relation Extraction	May 30, 2025	Knowledge DistillationLanguage Modeling	—Unverified
CRKD: Enhanced Camera-Radar Object Detection with Cross-modality Knowledge Distillation	Mar 28, 2024	3D Object DetectionAutonomous Driving	—Unverified
Cross Architecture Distillation for Face Recognition	Jun 26, 2023	Face RecognitionKnowledge Distillation	—Unverified
Cross-Architecture Knowledge Distillation	Jul 12, 2022	Knowledge Distillation	—Unverified
Cross-Class Feature Augmentation for Class Incremental Learning	Apr 4, 2023	class-incremental learningClass Incremental Learning	—Unverified
Cross domain knowledge compression in realtime optical flow prediction on ultrasound sequences	Feb 4, 2022	Knowledge DistillationOptical Flow Estimation	—Unverified
Cross-Domain Knowledge Distillation for Low-Resolution Human Pose Estimation	May 19, 2024	Knowledge DistillationPose Estimation	—Unverified
Cross-Level Multi-Instance Distillation for Self-Supervised Fine-Grained Visual Categorization	Jan 16, 2024	Fine-Grained Visual CategorizationKnowledge Distillation	—Unverified
Cross-Lingual Knowledge Distillation for Answer Sentence Selection in Low-Resource Languages	May 25, 2023	Knowledge DistillationMachine Translation	—Unverified
Cross-lingual Knowledge Distillation via Flow-based Voice Conversion for Robust Polyglot Text-To-Speech	Sep 15, 2023	Knowledge DistillationSpeech Synthesis	—Unverified
Cross-lingual Machine Reading Comprehension with Language Branch Knowledge Distillation	Oct 27, 2020	Knowledge DistillationMachine Reading Comprehension	—Unverified
Cross-Lingual NER for Financial Transaction Data in Low-Resource Languages	Jul 16, 2023	Cross-Lingual NERKnowledge Distillation	—Unverified
Cross-modal Contrastive Distillation for Instructional Activity Anticipation	Jan 18, 2022	Knowledge Distillation	—Unverified
Cross Modal Distillation for Flood Extent Mapping	Feb 16, 2023	Knowledge Distillation	—Unverified
Cross-modal knowledge distillation for action recognition	Oct 10, 2019	Action RecognitionKnowledge Distillation	—Unverified
Crossmodal Knowledge Distillation with WordNet-Relaxed Text Embeddings for Robust Image Classification	Mar 31, 2025	image-classificationImage Classification	—Unverified
Cross-Resolution Face Recognition via Prior-Aided Face Hallucination and Residual Knowledge Distillation	May 26, 2019	Face HallucinationFace Recognition	—Unverified
Canine EEG Helps Human: Cross-Species and Cross-Modality Epileptic Seizure Detection via Multi-Space Alignment	Dec 18, 2024	Brain Computer InterfaceDiagnostic	—Unverified
Cross-Task Knowledge Distillation in Multi-Task Recommendation	Feb 20, 2022	Knowledge DistillationMulti-Task Learning	—Unverified
Crowd Counting with Online Knowledge Learning	Mar 18, 2023	Crowd CountingEdge-computing	—Unverified
CTC Blank Triggered Dynamic Layer-Skipping for Efficient CTC-based Speech Recognition	Jan 4, 2024	Knowledge Distillationspeech-recognition	—Unverified
CULL-MT: Compression Using Language and Layer pruning for Machine Translation	Nov 10, 2024	Knowledge DistillationMachine Translation	—Unverified
CustomKD: Customizing Large Vision Foundation for Edge Model Improvement via Knowledge Distillation	Mar 23, 2025	Domain AdaptationKnowledge Distillation	—Unverified
D^3ETR: Decoder Distillation for Detection Transformer	Nov 17, 2022	DecoderKnowledge Distillation	—Unverified
D3T-GAN: Data-Dependent Domain Transfer GANs for Few-shot Image Generation	May 12, 2022	Image GenerationKnowledge Distillation	—Unverified
DA-CIL: Towards Domain Adaptive Class-Incremental 3D Object Detection	Dec 5, 2022	3D Object Detectionclass-incremental learning	—Unverified
DaFKD: Domain-Aware Federated Knowledge Distillation	Jan 1, 2023	Knowledge Distillation	—Unverified
DAKD: Data Augmentation and Knowledge Distillation using Diffusion Models for SAR Oil Spill Segmentation	Dec 11, 2024	Data AugmentationKnowledge Distillation	—Unverified
DASECount: Domain-Agnostic Sample-Efficient Wireless Indoor Crowd Counting via Few-shot Learning	Nov 18, 2022	Crowd CountingFew-Shot Learning	—Unverified
Data-Driven Compression of Convolutional Neural Networks	Nov 28, 2019	Knowledge DistillationModel Compression	—Unverified
Data Efficient Acoustic Scene Classification using Teacher-Informed Confusing Class Instruction	Sep 18, 2024	Acoustic Scene ClassificationData Augmentation	—Unverified
Data-efficient Event Camera Pre-training via Disentangled Masked Modeling	Mar 1, 2024	Knowledge DistillationSelf-Supervised Learning	—Unverified
Data-Efficient Ranking Distillation for Image Retrieval	Jul 10, 2020	Image RetrievalKnowledge Distillation	—Unverified
Data-Free Adversarial Knowledge Distillation for Graph Neural Networks	May 8, 2022	Generative Adversarial NetworkGraph Classification	—Unverified
Dense Depth Distillation with Out-of-Distribution Simulated Images	Aug 26, 2022	Data-free Knowledge DistillationDepth Estimation	—Unverified
Data-Free Distillation of Language Model by Text-to-Text Transfer	Nov 3, 2023	Data-free Knowledge DistillationDiversity	—Unverified

Show:10 25 50

← PrevPage 61 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified