Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1601–1650 of 4240 papers

Title	Date	Tasks	Status
Single-stage TTS with Masked Audio Token Modeling and Semantic Knowledge Distillation	Sep 17, 2024	Knowledge DistillationSpeech Synthesis	—Unverified
Unleashing the Potential of Mamba: Boosting a LiDAR 3D Sparse Detector by Using Cross-Model Knowledge Distillation	Sep 17, 2024	3D Object DetectionAutonomous Driving	—Unverified
Time-Series Forecasting, Knowledge Distillation, and Refinement within a Multimodal PDE Foundation Model	Sep 17, 2024	Knowledge DistillationOperator learning	CodeCode Available
Human Insights Driven Latent Space for Different Driving Perspectives: A Unified Encoder for Efficient Multi-Task Inference	Sep 16, 2024	Autonomous DrivingKnowledge Distillation	—Unverified
Frequency-Guided Masking for Enhanced Vision Self-Supervised Learning	Sep 16, 2024	Few-Shot Learningimage-classification	CodeCode Available
Integrated Multi-Level Knowledge Distillation for Enhanced Speaker Verification	Sep 14, 2024	Knowledge DistillationSpeaker Verification	—Unverified
Joint Semantic Knowledge Distillation and Masked Acoustic Modeling for Full-band Speech Restoration with Improved Intelligibility	Sep 14, 2024	Knowledge DistillationLanguage Modeling	—Unverified
AWF: Adaptive Weight Fusion for Enhanced Class Incremental Semantic Segmentation	Sep 13, 2024	Class-Incremental Semantic SegmentationKnowledge Distillation	—Unverified
DiReDi: Distillation and Reverse Distillation for AIoT Applications	Sep 12, 2024	Knowledge DistillationManagement	—Unverified
Learn from Balance: Rectifying Knowledge Transfer for Long-Tailed Scenarios	Sep 12, 2024	Knowledge DistillationTransfer Learning	—Unverified
Enhancing CTC-Based Visual Speech Recognition	Sep 11, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
DS-ViT: Dual-Stream Vision Transformer for Cross-Task Distillation in Alzheimer's Early Diagnosis	Sep 11, 2024	ClassificationKnowledge Distillation	—Unverified
Privacy-Preserving Federated Learning with Consistency via Knowledge Distillation Using Conditional Generator	Sep 11, 2024	DiversityFederated Learning	—Unverified
A Continual and Incremental Learning Approach for TinyML On-device Training Using Dataset Distillation and Model Size Adaption	Sep 11, 2024	Anomaly DetectionComputational Efficiency	—Unverified
How Redundant Is the Transformer Stack in Speech Representation Models?	Sep 10, 2024	Knowledge DistillationSpeaker Identification	—Unverified
Knowledge Distillation via Query Selection for Detection Transformer	Sep 10, 2024	Knowledge Distillationobject-detection	—Unverified
Applied Federated Model Personalisation in the Industrial Domain: A Comparative Study	Sep 10, 2024	Active LearningFederated Learning	—Unverified
Distilling Generative-Discriminative Representations for Very Low-Resolution Face Recognition	Sep 10, 2024	Face RecognitionKnowledge Distillation	—Unverified
Look One and More: Distilling Hybrid Order Relational Knowledge for Cross-Resolution Image Recognition	Sep 9, 2024	Face Recognitionimage-classification	—Unverified
Joint Input and Output Coordination for Class-Incremental Learning	Sep 9, 2024	class-incremental learningClass Incremental Learning	—Unverified
FedBrain-Distill: Communication-Efficient Federated Brain Tumor Classification Using Ensemble Knowledge Distillation on Non-IID Data	Sep 9, 2024	Brain Tumor ClassificationFederated Learning	CodeCode Available
Complex Emotion Recognition System using basic emotions via Facial Expression, EEG, and ECG Signals: a review	Sep 9, 2024	EEGElectroencephalogram (EEG)	—Unverified
LoCa: Logit Calibration for Knowledge Distillation	Sep 7, 2024	image-classificationImage Classification	—Unverified
SCARF: Scalable Continual Learning Framework for Memory-efficient Multiple Neural Radiance Fields	Sep 6, 2024	Continual LearningKnowledge Distillation	—Unverified
Data-free Distillation with Degradation-prompt Diffusion for Multi-weather Image Restoration	Sep 5, 2024	Image RestorationKnowledge Distillation	—Unverified
Experimentation in Content Moderation using RWKV	Sep 5, 2024	CPUKnowledge Distillation	—Unverified
Low-Resolution Object Recognition with Cross-Resolution Relational Contrastive Distillation	Sep 4, 2024	Face RecognitionKnowledge Distillation	—Unverified
Sorbet: A Neuromorphic Hardware-Compatible Transformer-Based Spiking Language Model	Sep 4, 2024	Knowledge DistillationLanguage Modeling	—Unverified
Non-target Divergence Hypothesis: Toward Understanding Domain Gaps in Cross-Modal Knowledge Distillation	Sep 4, 2024	Knowledge Distillation	—Unverified
Efficient Image Compression Using Advanced State Space Models	Sep 4, 2024	Computational EfficiencyImage Compression	—Unverified
Collaborative Learning for Enhanced Unsupervised Domain Adaptation	Sep 4, 2024	Domain AdaptationKnowledge Distillation	—Unverified
Adaptive Explicit Knowledge Transfer for Knowledge Distillation	Sep 3, 2024	Knowledge DistillationTransfer Learning	—Unverified
Improving Apple Object Detection with Occlusion-Enhanced Distillation	Sep 3, 2024	Knowledge DistillationObject	—Unverified
Low-Resolution Face Recognition via Adaptable Instance-Relation Distillation	Sep 3, 2024	Face RecognitionKnowledge Distillation	—Unverified
Efficient Point Cloud Classification via Offline Distillation Framework and Negative-Weight Self-Distillation Technique	Sep 3, 2024	Data AugmentationKnowledge Distillation	—Unverified
Compressing VAE-Based Out-of-Distribution Detectors for Embedded Deployment	Sep 2, 2024	CPUGPU	—Unverified
HiTSR: A Hierarchical Transformer for Reference-based Super-Resolution	Aug 30, 2024	Image Super-ResolutionKnowledge Distillation	CodeCode Available
How Knowledge Distillation Mitigates the Synthetic Gap in Fair Face Recognition	Aug 30, 2024	Face RecognitionFairness	CodeCode Available
MedDet: Generative Adversarial Distillation for Efficient Cervical Disc Herniation Detection	Aug 30, 2024	Knowledge DistillationModel Compression	CodeCode Available
MST-KD: Multiple Specialized Teachers Knowledge Distillation for Fair Face Recognition	Aug 29, 2024	Face RecognitionKnowledge Distillation	CodeCode Available
Smaller, Weaker, Yet Better: Training LLM Reasoners via Compute-Optimal Sampling	Aug 29, 2024	DiversityKnowledge Distillation	—Unverified
VLM-KD: Knowledge Distillation from VLM for Long-Tail Visual Recognition	Aug 29, 2024	Knowledge DistillationLanguage Modeling	—Unverified
Boosting Lossless Speculative Decoding via Feature Sampling and Partial Alignment Distillation	Aug 28, 2024	Knowledge DistillationLanguage Modelling	—Unverified
Online pre-training with long-form videos	Aug 28, 2024	Action RecognitionContrastive Learning	—Unverified
ModalityMirror: Improving Audio Classification in Modality Heterogeneity Federated Learning with Multimodal Distillation	Aug 28, 2024	Audio ClassificationFederated Learning	—Unverified
Bridging the Gap: Unpacking the Hidden Challenges in Knowledge Distillation for Online Ranking Systems	Aug 26, 2024	Knowledge DistillationRecommendation Systems	—Unverified
Let Video Teaches You More: Video-to-Image Knowledge Distillation using DEtection TRansformer for Medical Video Lesion Detection	Aug 26, 2024	Knowledge DistillationLesion Detection	—Unverified
TSAK: Two-Stage Semantic-Aware Knowledge Distillation for Efficient Wearable Modality and Model Optimization in Manufacturing Lines	Aug 26, 2024	Activity RecognitionHuman Activity Recognition	—Unverified
On-Device Language Models: A Comprehensive Review	Aug 26, 2024	Knowledge DistillationQuantization	CodeCode Available
Bring the Power of Diffusion Model to Defect Detection	Aug 25, 2024	Defect DetectionDenoising	—Unverified

Show:10 25 50

← PrevPage 33 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified