Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 4240 papers

Title	Date	Tasks	Status	Hype
Scaling Sparse and Dense Retrieval in Decoder-Only LLMs	Feb 21, 2025	DecoderKnowledge Distillation	CodeCode Available	1
Can LLM Watermarks Robustly Prevent Unauthorized Knowledge Distillation?	Feb 17, 2025	Knowledge DistillationLanguage Modeling	CodeCode Available	1
DA-Mamba: Domain Adaptive Hybrid Mamba-Transformer Based One-Stage Object Detection	Feb 16, 2025	Domain AdaptationKnowledge Distillation	CodeCode Available	1
Enhancing Cross-Tokenizer Knowledge Distillation with Contextual Dynamical Mapping	Feb 16, 2025	Code GenerationInstruction Following	CodeCode Available	1
Audio-Visual Representation Learning via Knowledge Distillation from Speech Foundation Models	Feb 9, 2025	Audio-Visual Speech RecognitionAutomatic Speech Recognition	CodeCode Available	1
Towards Unified Music Emotion Recognition across Dimensional and Categorical Models	Feb 6, 2025	Emotion RecognitionKnowledge Distillation	CodeCode Available	1
Return of the Encoder: Maximizing Parameter Efficiency for SLMs	Jan 27, 2025	Computational EfficiencyCPU	CodeCode Available	1
Towards Fast, Specialized Machine Learning Force Fields: Distilling Foundation Models via Energy Hessians	Jan 15, 2025	Computational chemistryKnowledge Distillation	CodeCode Available	1
Efficient Traffic Prediction Through Spatio-Temporal Distillation	Jan 15, 2025	Knowledge DistillationPrediction	CodeCode Available	1
From My View to Yours: Ego-Augmented Learning in Large Vision Language Models for Understanding Exocentric Daily Living Activities	Jan 10, 2025	Human-Object Interaction DetectionKnowledge Distillation	CodeCode Available	1
ConcealGS: Concealing Invisible Copyright Information in 3D Gaussian Splatting	Jan 7, 2025	3D ReconstructionKnowledge Distillation	CodeCode Available	1
V2X-DGPE: Addressing Domain Gaps and Pose Errors for Robust Collaborative 3D Object Detection	Jan 4, 2025	3D Object DetectionKnowledge Distillation	CodeCode Available	1
Align-KD: Distilling Cross-Modal Alignment Knowledge for Mobile Vision-Language Large Model Enhancement	Jan 1, 2025	cross-modal alignmentKnowledge Distillation	CodeCode Available	1
LiRCDepth: Lightweight Radar-Camera Depth Estimation via Knowledge Distillation and Uncertainty Guidance	Dec 20, 2024	Computational EfficiencyDepth Estimation	CodeCode Available	1
Efficient Fine-Tuning and Concept Suppression for Pruned Diffusion Models	Dec 19, 2024	Bilevel OptimizationKnowledge Distillation	CodeCode Available	1
Multi-Level Optimal Transport for Universal Cross-Tokenizer Knowledge Distillation on Language Models	Dec 19, 2024	Knowledge Distillation	CodeCode Available	1
Relation-Guided Adversarial Learning for Data-free Knowledge Transfer	Dec 16, 2024	Data-free Knowledge DistillationData Free Quantization	CodeCode Available	1
Dynamic Contrastive Knowledge Distillation for Efficient Image Restoration	Dec 12, 2024	Contrastive LearningImage Restoration	CodeCode Available	1
Unlocking the Potential of Reverse Distillation for Anomaly Detection	Dec 10, 2024	Anomaly DetectionDecoder	CodeCode Available	1
Cloud Object Detector Adaptation by Integrating Different Source Knowledge	Dec 10, 2024	Domain AdaptationKnowledge Distillation	CodeCode Available	1
One-shot Federated Learning via Synthetic Distiller-Distillate Communication	Dec 6, 2024	Data-free Knowledge DistillationFederated Learning	CodeCode Available	1
Align-KD: Distilling Cross-Modal Alignment Knowledge for Mobile Vision-Language Model	Dec 2, 2024	cross-modal alignmentKnowledge Distillation	CodeCode Available	1
Vision Mamba Distillation for Low-resolution Fine-grained Image Classification	Nov 27, 2024	ClassificationFine-Grained Image Classification	CodeCode Available	1
Learn from Foundation Model: Fruit Detection Model without Manual Annotation	Nov 25, 2024	Instance SegmentationKnowledge Distillation	CodeCode Available	1
LLM-Neo: Parameter Efficient Knowledge Distillation for Large Language Models	Nov 11, 2024	Knowledge DistillationLanguage Modeling	CodeCode Available	1
Towards Competitive Search Relevance For Inference-Free Learned Sparse Retrievers	Nov 7, 2024	Knowledge DistillationRetrieval	CodeCode Available	1
KD-LoRA: A Hybrid Approach to Efficient Fine-Tuning with LoRA and Knowledge Distillation	Oct 28, 2024	GPUKnowledge Distillation	CodeCode Available	1
TransAgent: Transfer Vision-Language Foundation Models with Heterogeneous Agent Collaboration	Oct 16, 2024	Knowledge DistillationTransfer Learning	CodeCode Available	1
Breaking Modality Gap in RGBT Tracking: Coupled Knowledge Distillation	Oct 15, 2024	Knowledge DistillationRgb-T Tracking	CodeCode Available	1
Mentor-KD: Making Small Language Models Better Multi-step Reasoners	Oct 11, 2024	Knowledge Distillation	CodeCode Available	1
PairDistill: Pairwise Relevance Distillation for Dense Retrieval	Oct 2, 2024	Information RetrievalKnowledge Distillation	CodeCode Available	1
HarmAug: Effective Data Augmentation for Knowledge Distillation of Safety Guard Models	Oct 2, 2024	Data AugmentationKnowledge Distillation	CodeCode Available	1
Domain Consistency Representation Learning for Lifelong Person Re-Identification	Sep 30, 2024	AttributeKnowledge Distillation	CodeCode Available	1
AIM 2024 Challenge on UHD Blind Photo Quality Assessment	Sep 24, 2024	4kComputational Efficiency	CodeCode Available	1
Neural-Symbolic Collaborative Distillation: Advancing Small Language Models for Complex Reasoning Tasks	Sep 20, 2024	ARCGSM8K	CodeCode Available	1
Effective Pre-Training of Audio Transformers for Sound Event Detection	Sep 14, 2024	Data AugmentationEvent Detection	CodeCode Available	1
EchoDFKD: Data-Free Knowledge Distillation for Cardiac Ultrasound Segmentation using Synthetic Data	Sep 11, 2024	Data-free Knowledge DistillationKnowledge Distillation	CodeCode Available	1
EasyST: A Simple Framework for Spatio-Temporal Prediction	Sep 10, 2024	Knowledge DistillationPrediction	CodeCode Available	1
LEROjD: Lidar Extended Radar-Only Object Detection	Sep 9, 2024	3D Object DetectionKnowledge Distillation	CodeCode Available	1
DKDM: Data-Free Knowledge Distillation for Diffusion Models with Any Architecture	Sep 5, 2024	Data-free Knowledge DistillationDenoising	CodeCode Available	1
Designing Large Foundation Models for Efficient Training and Inference: A Survey	Sep 3, 2024	Knowledge DistillationModel Compression	CodeCode Available	1
MobileIQA: Exploiting Mobile-level Diverse Opinion Network For No-Reference Image Quality Assessment Using Knowledge Distillation	Sep 2, 2024	Computational EfficiencyImage Quality Assessment	CodeCode Available	1
Diffusion-Driven Data Replay: A Novel Approach to Combat Forgetting in Federated Class Continual Learning	Sep 2, 2024	Continual LearningContrastive Learning	CodeCode Available	1
GenFormer -- Generated Images are All You Need to Improve Robustness of Transformers on Small Datasets	Aug 26, 2024	AllData Augmentation	CodeCode Available	1
Knowledge Distillation with Refined Logits	Aug 14, 2024	Knowledge DistillationModel Compression	CodeCode Available	1
One Step Diffusion-based Super-Resolution with Time-Aware Distillation	Aug 14, 2024	Image Super-ResolutionKnowledge Distillation	CodeCode Available	1
Real-time Event Recognition of Long-distance Distributed Vibration Sensing with Knowledge Distillation and Hardware Acceleration	Aug 7, 2024	GPUIntrusion Detection	CodeCode Available	1
Unsupervised Domain Adaption Harnessing Vision-Language Pre-training	Aug 5, 2024	Domain AdaptationKnowledge Distillation	CodeCode Available	1
Pruning Large Language Models with Semi-Structural Adaptive Sparse Training	Jul 30, 2024	GPUKnowledge Distillation	CodeCode Available	1
Modality-Balanced Learning for Multimedia Recommendation	Jul 26, 2024	Collaborative Filteringcounterfactual	CodeCode Available	1

Show:10 25 50

← PrevPage 4 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified