Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1851–1900 of 4240 papers

Title	Date	Tasks	Status
Aligning in a Compact Space: Contrastive Knowledge Distillation between Heterogeneous Architectures	May 28, 2024	Contrastive LearningKnowledge Distillation	—Unverified
UniCompress: Enhancing Multi-Data Medical Image Compression with Knowledge Distillation	May 27, 2024	Image CompressionKnowledge Distillation	—Unverified
TIMA: Text-Image Mutual Awareness for Balancing Zero-Shot Adversarial Robustness and Generalization Ability	May 27, 2024	Adversarial RobustnessKnowledge Distillation	—Unverified
P4: Towards private, personalized, and Peer-to-Peer learning	May 27, 2024	Knowledge Distillation	—Unverified
A Classifier-Free Incremental Learning Framework for Scalable Medical Image Segmentation	May 25, 2024	Contrastive LearningImage Segmentation	—Unverified
Noisy Data Meets Privacy: Training Local Models with Post-Processed Remote Queries	May 25, 2024	Knowledge DistillationModel extraction	—Unverified
Harnessing Increased Client Participation with Cohort-Parallel Federated Learning	May 24, 2024	Federated Learningimage-classification	—Unverified
Leveraging knowledge distillation for partial multi-task learning from multiple remote sensing datasets	May 24, 2024	Knowledge DistillationMulti-Task Learning	CodeCode Available
AdaGMLP: AdaBoosting GNN-to-MLP Knowledge Distillation	May 23, 2024	Knowledge Distillation	CodeCode Available
Pre-Trained Vision-Language Models as Partial Annotators	May 23, 2024	Contrastive Learningimage-classification	—Unverified
Efficient Multitask Dense Predictor via Binarization	May 23, 2024	BinarizationKnowledge Distillation	CodeCode Available
HoverFast: an accurate, high-throughput, clinically deployable nuclear segmentation tool for brightfield digital pathology images	May 22, 2024	GPUKnowledge Distillation	—Unverified
Low-Resolution Chest X-ray Classification via Knowledge Distillation and Multi-task Learning	May 22, 2024	DiagnosticKnowledge Distillation	—Unverified
Data-Free Federated Class Incremental Learning with Diffusion-Based Generative Memory	May 22, 2024	class-incremental learningClass Incremental Learning	—Unverified
Joint Optimization of Streaming and Non-Streaming Automatic Speech Recognition with Multi-Decoder and Knowledge Distillation	May 22, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Why Not Transform Chat Large Language Models to Non-English?	May 22, 2024	Knowledge Distillation	CodeCode Available
Exploring Dark Knowledge under Various Teacher Capacities and Addressing Capacity Mismatch	May 21, 2024	Knowledge Distillation	—Unverified
Active Object Detection with Knowledge Aggregation and Distillation from Large Models	May 21, 2024	Active Object DetectionDecision Making	CodeCode Available
TinyM^2Net-V3: Memory-Aware Compressed Multimodal Deep Neural Networks for Sustainable Edge Deployment	May 20, 2024	Knowledge DistillationModel Compression	—Unverified
GeoMask3D: Geometrically Informed Mask Selection for Self-Supervised Point Cloud Learning in 3D	May 20, 2024	Knowledge DistillationSelf-Supervised Learning	—Unverified
Federated Learning for Time-Series Healthcare Sensing with Incomplete Modalities	May 20, 2024	Computational EfficiencyFederated Learning	CodeCode Available
Stereo-Knowledge Distillation from dpMV to Dual Pixels for Light Field Video Reconstruction	May 20, 2024	Autonomous DrivingKnowledge Distillation	—Unverified
Evolving Storytelling: Benchmarks and Methods for New Character Customization with Diffusion Models	May 20, 2024	Knowledge DistillationStory Generation	—Unverified
Efficiency optimization of large-scale language models based on deep learning in natural language processing tasks	May 20, 2024	Inference OptimizationKnowledge Distillation	—Unverified
Distill-then-prune: An Efficient Compression Framework for Real-time Stereo Matching Network on Edge Devices	May 20, 2024	Knowledge DistillationStereo Matching	—Unverified
Hierarchical Selective Classification	May 19, 2024	ClassificationKnowledge Distillation	—Unverified
Nickel and Diming Your GAN: A Dual-Method Approach to Enhancing GAN Efficiency via Knowledge Distillation	May 19, 2024	Knowledge Distillation	—Unverified
Cross-Domain Knowledge Distillation for Low-Resolution Human Pose Estimation	May 19, 2024	Knowledge DistillationPose Estimation	—Unverified
INDUS: Effective and Efficient Language Models for Scientific Applications	May 17, 2024	Contrastive LearningInformation Retrieval	—Unverified
Densely Distilling Cumulative Knowledge for Continual Learning	May 16, 2024	AllContinual Learning	—Unverified
Distilling Implicit Multimodal Knowledge into Large Language Models for Zero-Resource Dialogue Generation	May 16, 2024	Dialogue GenerationKnowledge Distillation	CodeCode Available
QCRD: Quality-guided Contrastive Rationale Distillation for Large Language Models	May 14, 2024	Contrastive LearningDenoising	—Unverified
GLiRA: Black-Box Membership Inference Attack via Knowledge Distillation	May 13, 2024	image-classificationImage Classification	CodeCode Available
Meta-Learned Modality-Weighted Knowledge Distillation for Robust Multi-Modal Learning with Missing Data	May 12, 2024	Brain Tumor SegmentationClassification	CodeCode Available
AdaKD: Dynamic Knowledge Distillation of ASR models using Adaptive Loss Weighting	May 11, 2024	Knowledge DistillationModel Compression	—Unverified
For the Misgendered Chinese in Gender Bias Research: Multi-Task Learning with Knowledge Distillation for Pinyin Name-Gender Prediction	May 10, 2024	Gender PredictionKnowledge Distillation	—Unverified
MH-pFLID: Model Heterogeneous personalized Federated Learning via Injection and Distillation for Medical Data Analysis	May 10, 2024	Federated LearningKnowledge Distillation	—Unverified
Attend, Distill, Detect: Attention-aware Entropy Distillation for Anomaly Detection	May 10, 2024	Anomaly DetectionKnowledge Distillation	CodeCode Available
From Algorithm to Hardware: A Survey on Efficient and Safe Deployment of Deep Neural Networks	May 9, 2024	Knowledge DistillationModel Compression	—Unverified
CourseGPT-zh: an Educational Large Language Model Based on Knowledge Distillation Incorporating Prompt Optimization	May 8, 2024	DiversityKnowledge Distillation	—Unverified
Less-supervised learning with knowledge distillation for sperm morphology analysis	May 8, 2024	Anomaly DetectionKnowledge Distillation	CodeCode Available
Markowitz Meets Bellman: Knowledge-distilled Reinforcement Learning for Portfolio Management	May 8, 2024	Knowledge DistillationManagement	—Unverified
A Review on Discriminative Self-supervised Learning Methods in Computer Vision	May 8, 2024	ClusteringKnowledge Distillation	—Unverified
ELiTe: Efficient Image-to-LiDAR Knowledge Transfer for Semantic Segmentation	May 7, 2024	Knowledge DistillationLIDAR Semantic Segmentation	—Unverified
GOVERN: Gradient Orientation Vote Ensemble for Multi-Teacher Reinforced Distillation	May 6, 2024	Knowledge DistillationQuestion Answering	—Unverified
Mind the Gap Between Synthetic and Real: Utilizing Transfer Learning to Probe the Boundaries of Stable Diffusion Generated Data	May 6, 2024	Data-free Knowledge DistillationKnowledge Distillation	—Unverified
Exploring Extreme Quantization in Spiking Language Models	May 4, 2024	Knowledge DistillationLanguage Modeling	—Unverified
Sub-goal Distillation: A Method to Improve Small Language Agents	May 4, 2024	Imitation LearningKnowledge Distillation	CodeCode Available
Semantic Objective Functions: A distribution-aware method for adding logical constraints in deep learning	May 3, 2024	Knowledge Distillation	—Unverified
Efficient Compression of Multitask Multilingual Speech Models	May 2, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified

Show:10 25 50

← PrevPage 38 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified