Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2751–2800 of 4240 papers

Title	Date	Tasks	Status
Rethinking Feature-Based Knowledge Distillation for Face Recognition	Jan 1, 2023	Face RecognitionGPU	—Unverified
CLIPPING: Distilling CLIP-Based Models With a Student Base for Video-Language Retrieval	Jan 1, 2023	Knowledge DistillationLanguage Modelling	—Unverified
Distilling Focal Knowledge From Imperfect Expert for 3D Object Detection	Jan 1, 2023	3D geometry3D Object Detection	CodeCode Available
ScaleKD: Distilling Scale-Aware Knowledge in Small Object Detector	Jan 1, 2023	Knowledge Distillationobject-detection	—Unverified
Active Exploration of Multimodal Complementarity for Few-Shot Action Recognition	Jan 1, 2023	Action RecognitionFew-Shot action recognition	—Unverified
MEDIC: Remove Model Backdoors via Importance Driven Cloning	Jan 1, 2023	Knowledge Distillationmodel	—Unverified
You Do Not Need Additional Priors or Regularizers in Retinex-Based Low-Light Image Enhancement	Jan 1, 2023	Contrastive LearningImage Enhancement	—Unverified
Automated Knowledge Distillation via Monte Carlo Tree Search	Jan 1, 2023	image-classificationImage Classification	CodeCode Available
Distilling Cross-Temporal Contexts for Continuous Sign Language Recognition	Jan 1, 2023	Knowledge DistillationSign Language Recognition	—Unverified
DaFKD: Domain-Aware Federated Knowledge Distillation	Jan 1, 2023	Knowledge Distillation	—Unverified
TripLe: Revisiting Pretrained Model Reuse and Progressive Learning for Efficient Vision Transformer Scaling and Searching	Jan 1, 2023	Knowledge DistillationNeural Architecture Search	—Unverified
ICD-Face: Intra-class Compactness Distillation for Face Recognition	Jan 1, 2023	Face RecognitionKnowledge Distillation	—Unverified
Knowledge-Spreader: Learning Semi-Supervised Facial Action Dynamics by Consistifying Knowledge Granularity	Jan 1, 2023	Knowledge Distillation	—Unverified
Beyond the Limitation of Monocular 3D Detector via Knowledge Distillation	Jan 1, 2023	Knowledge Distillation	CodeCode Available
SMOC-Net: Leveraging Camera Pose for Self-Supervised Monocular Object Pose Estimation	Jan 1, 2023	6D Pose Estimation using RGBKnowledge Distillation	—Unverified
Tiny Updater: Towards Efficient Neural Network-Driven Software Updating	Jan 1, 2023	Efficient Neural Networkimage-classification	CodeCode Available
Continual Segment: Towards a Single, Unified and Non-forgetting Continual Segmentation Model of 143 Whole-body Organs in CT Scans	Jan 1, 2023	Continual Semantic SegmentationDecoder	—Unverified
Alleviating Catastrophic Forgetting of Incremental Object Detection via Within-Class and Between-Class Knowledge Distillation	Jan 1, 2023	Knowledge Distillationobject-detection	—Unverified
Multi-Task Learning with Knowledge Distillation for Dense Prediction	Jan 1, 2023	Boundary DetectionDepth Estimation	—Unverified
Incrementer: Transformer for Class-Incremental Semantic Segmentation With Knowledge Distillation Focusing on Old Class	Jan 1, 2023	Class-Incremental Semantic SegmentationDecoder	—Unverified
Masked Autoencoders Are Stronger Knowledge Distillers	Jan 1, 2023	DecoderKnowledge Distillation	—Unverified
Endpoints Weight Fusion for Class Incremental Semantic Segmentation	Jan 1, 2023	class-incremental learningClass Incremental Learning	—Unverified
X3KD: Knowledge Distillation Across Modalities, Tasks and Stages for Multi-Camera 3D Object Detection	Jan 1, 2023	3D Object DetectionInstance Segmentation	—Unverified
Bilateral Memory Consolidation for Continual Learning	Jan 1, 2023	Continual LearningKnowledge Distillation	—Unverified
FedICT: Federated Multi-task Distillation for Multi-access Edge Computing	Jan 1, 2023	Edge-computingFederated Learning	CodeCode Available
Probabilistic Knowledge Distillation of Face Ensembles	Jan 1, 2023	Face Image QualityFace Recognition	—Unverified
Boosting Accuracy and Robustness of Student Models via Adaptive Adversarial Distillation	Jan 1, 2023	Adversarial RobustnessKnowledge Distillation	—Unverified
A Unified Object Counting Network with Object Occupation Prior	Dec 29, 2022	Crowd CountingKnowledge Distillation	CodeCode Available
Prototype-guided Cross-task Knowledge Distillation for Large-scale Models	Dec 26, 2022	Knowledge Distillation	CodeCode Available
BD-KD: Balancing the Divergences for Online Knowledge Distillation	Dec 25, 2022	Knowledge DistillationModel Compression	—Unverified
CAMeMBERT: Cascading Assistant-Mediated Multilingual BERT	Dec 22, 2022	Knowledge Distillation	—Unverified
UNIKD: UNcertainty-filtered Incremental Knowledge Distillation for Neural Implicit Representation	Dec 21, 2022	3D ReconstructionIncremental Learning	CodeCode Available
RangeAugment: Efficient Online Augmentation with Range Learning	Dec 20, 2022	Knowledge Distillationobject-detection	—Unverified
Diffusion Glancing Transformer for Parallel Sequence to Sequence Learning	Dec 20, 2022	Knowledge DistillationMachine Translation	—Unverified
Fine-Grained Distillation for Long Document Retrieval	Dec 20, 2022	Knowledge DistillationRetrieval	—Unverified
Adam: Dense Retrieval Distillation with Adaptive Dark Examples	Dec 20, 2022	Knowledge DistillationRetrieval	—Unverified
Multi-View Knowledge Distillation from Crowd Annotations for Out-of-Domain Generalization	Dec 19, 2022	Domain GeneralizationKnowledge Distillation	—Unverified
I2D2: Inductive Knowledge Distillation with NeuroLogic and Self-Imitation	Dec 19, 2022	Imitation LearningKnowledge Distillation	—Unverified
KNIFE: Distilling Reasoning Knowledge From Free-Text Rationales	Dec 19, 2022	Knowledge DistillationLanguage Modelling	—Unverified
Continual Knowledge Distillation for Neural Machine Translation	Dec 18, 2022	Knowledge DistillationMachine Translation	CodeCode Available
3D Point Cloud Pre-training with Knowledge Distillation from 2D Images	Dec 17, 2022	Concept AlignmentKnowledge Distillation	—Unverified
Teaching Small Language Models to Reason	Dec 16, 2022	GSM8KKnowledge Distillation	—Unverified
Swing Distillation: A Privacy-Preserving Knowledge Distillation Framework	Dec 16, 2022	Knowledge DistillationModel Compression	—Unverified
Hybrid Paradigm-based Brain-Computer Interface for Robotic Arm Control	Dec 14, 2022	Brain Computer InterfaceEEG	—Unverified
Domain Adaptation for Dense Retrieval through Self-Supervision by Pseudo-Relevance Labeling	Dec 13, 2022	Domain AdaptationInformation Retrieval	—Unverified
Multimodal Matching-aware Co-attention Networks with Mutual Knowledge Distillation for Fake News Detection	Dec 12, 2022	Fake News DetectionImage-text matching	—Unverified
Improving Generalization of Pre-trained Language Models via Stochastic Weight Averaging	Dec 12, 2022	Knowledge DistillationQuestion Answering	—Unverified
Siamese Sleep Transformer For Robust Sleep Stage Scoring With Self-knowledge Distillation and Selective Batch Sampling	Dec 12, 2022	Knowledge DistillationSelf-Knowledge Distillation	—Unverified
Continuation KD: Improved Knowledge Distillation through the Lens of Continuation Optimization	Dec 12, 2022	Knowledge DistillationNatural Language Understanding	—Unverified
Teaching What You Should Teach: A Data-Based Distillation Method	Dec 11, 2022	Data AugmentationKnowledge Distillation	—Unverified

Show:10 25 50

← PrevPage 56 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified