Knowledge Distillation

Knowledge distillation is the process of transferring knowledge from a large model to a smaller one. While large models (such as very deep neural networks or ensembles of many models) have higher knowledge capacity than small models, this capacity might not be fully utilized.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 401–450 of 4240 papers

Title	Date	Tasks	Status	Hype
A Diversity-Enhanced Knowledge Distillation Model for Practical Math Word Problem Solving	Jan 7, 2025	DiversityKnowledge Distillation	CodeCode Available	0
A Diffusion Model and Knowledge Distillation Framework for Robust Coral Detection in Complex Underwater Environments	Jan 6, 2025	2D Object DetectionKnowledge Distillation	CodeCode Available	0
Comprehensive Pathological Image Segmentation via Teacher Aggregation for Tumor Microenvironment Analysis	Jan 6, 2025	Decision MakingDiversity	—Unverified	0
Knowledge Distillation with Adapted Weight	Jan 6, 2025	4kFairness	—Unverified	0
LightGNN: Simple Graph Neural Network for Recommendation	Jan 6, 2025	Computational EfficiencyGraph Neural Network	CodeCode Available	2
Strategic Fusion Optimizes Transformer Compression	Jan 5, 2025	Knowledge DistillationModel Compression	—Unverified	0
Optimizing Edge AI: A Comprehensive Survey on Data, Model, and System Strategies	Jan 4, 2025	Edge-computingKnowledge Distillation	CodeCode Available	2
Prepending or Cross-Attention for Speech-to-Text? An Empirical Comparison	Jan 4, 2025	DecoderKnowledge Distillation	—Unverified	0
V2X-DGPE: Addressing Domain Gaps and Pose Errors for Robust Collaborative 3D Object Detection	Jan 4, 2025	3D Object DetectionKnowledge Distillation	CodeCode Available	1
Distillation-Enhanced Physical Adversarial Attacks	Jan 4, 2025	Adversarial AttackKnowledge Distillation	—Unverified	0
MoVE-KD: Knowledge Distillation for VLMs with Mixture of Visual Encoders	Jan 3, 2025	Knowledge DistillationMixture-of-Experts	—Unverified	0
DiagrammaticLearning: A Graphical Language for Compositional Training Regimes	Jan 2, 2025	Knowledge DistillationMulti-Task Learning	—Unverified	0
Simplification Is All You Need against Out-of-Distribution Overconfidence	Jan 1, 2025	AllAttribute	—Unverified	0
Tripartite Weight-Space Ensemble for Few-Shot Class-Incremental Learning	Jan 1, 2025	class-incremental learningClass Incremental Learning	—Unverified	0
Align-KD: Distilling Cross-Modal Alignment Knowledge for Mobile Vision-Language Large Model Enhancement	Jan 1, 2025	cross-modal alignmentKnowledge Distillation	CodeCode Available	1
VL2Lite: Task-Specific Knowledge Distillation from Large Vision-Language Models to Lightweight Networks	Jan 1, 2025	Classificationimage-classification	—Unverified	0
AVQACL: A Novel Benchmark for Audio-Visual Question Answering Continual Learning	Jan 1, 2025	Audio-visual Question AnsweringContinual Learning	CodeCode Available	0
Closest Neighbors are Harmful for Lightweight Masked Auto-encoders	Jan 1, 2025	Knowledge Distillation	CodeCode Available	0
Targeted Forgetting of Image Subgroups in CLIP Models	Jan 1, 2025	Knowledge DistillationUnsupervised Pre-training	—Unverified	0
Distilling Spatially-Heterogeneous Distortion Perception for Blind Image Quality Assessment	Jan 1, 2025	Blind Image Quality AssessmentImage Quality Assessment	—Unverified	0
BiM-VFI: Bidirectional Motion Field-Guided Frame Interpolation for Video with Non-uniform Motions	Jan 1, 2025	Knowledge DistillationMotion Estimation	—Unverified	0
Distilling Monocular Foundation Model for Fine-grained Depth Completion	Jan 1, 2025	Autonomous DrivingDepth Completion	—Unverified	0
ADU: Adaptive Detection of Unknown Categories in Black-Box Domain Adaptation	Jan 1, 2025	Domain AdaptationKnowledge Distillation	—Unverified	0
CoMBO: Conflict Mitigation via Branched Optimization for Class Incremental Segmentation	Jan 1, 2025	Knowledge DistillationSemantic Segmentation	—Unverified	0
Random Conditioning for Diffusion Model Compression with Distillation	Jan 1, 2025	DenoisingKnowledge Distillation	—Unverified	0
LENS-XAI: Redefining Lightweight and Explainable Network Security through Knowledge Distillation and Variational Autoencoders for Scalable Intrusion Detection in Cybersecurity	Jan 1, 2025	Computational EfficiencyIntrusion Detection	—Unverified	0
Pan-infection Foundation Framework Enables Multiple Pathogen Prediction	Dec 31, 2024	DiagnosticKnowledge Distillation	—Unverified	0
ECG-guided individual identification via PPG	Dec 30, 2024	Knowledge Distillation	—Unverified	0
Temporal reasoning for timeline summarisation in social media	Dec 30, 2024	Knowledge DistillationTimeline Summarization	—Unverified	0
Improving Acoustic Scene Classification in Low-Resource Conditions	Dec 30, 2024	Acoustic Scene ClassificationClassification	—Unverified	0
Invariant debiasing learning for recommendation via biased imputation	Dec 28, 2024	ImputationKnowledge Distillation	CodeCode Available	0
Learning an Adaptive and View-Invariant Vision Transformer for Real-Time UAV Tracking	Dec 28, 2024	Knowledge DistillationVisual Tracking	CodeCode Available	2
Injecting Explainability and Lightweight Design into Weakly Supervised Video Anomaly Detection Systems	Dec 28, 2024	Anomaly DetectionBinary Classification	—Unverified	0
Feature Alignment-Based Knowledge Distillation for Efficient Compression of Large Language Models	Dec 27, 2024	Knowledge DistillationModel Compression	—Unverified	0
Asymmetrical Reciprocity-based Federated Learning for Resolving Disparities in Medical Diagnosis	Dec 27, 2024	DiagnosticFederated Learning	CodeCode Available	0
SpectralKD: A Unified Framework for Interpreting and Distilling Vision Transformers via Spectral Analysis	Dec 26, 2024	Knowledge DistillationTransfer Learning	CodeCode Available	0
HTR-JAND: Handwritten Text Recognition with Joint Attention Network and Knowledge Distillation	Dec 24, 2024	Computational EfficiencyHandwritten Text Recognition	CodeCode Available	0
Better Knowledge Enhancement for Privacy-Preserving Cross-Project Defect Prediction	Dec 23, 2024	Federated LearningKnowledge Distillation	—Unverified	0
Exploiting Label Skewness for Spiking Neural Networks in Federated Learning	Dec 23, 2024	Federated LearningKnowledge Distillation	—Unverified	0
Distilling Large Language Models for Efficient Clinical Information Extraction	Dec 21, 2024	Knowledge Distillationnamed-entity-recognition	—Unverified	0
Cross-View Consistency Regularisation for Knowledge Distillation	Dec 21, 2024	Knowledge Distillation	CodeCode Available	0
CBNN: 3-Party Secure Framework for Customized Binary Neural Networks Inference	Dec 21, 2024	BinarizationKnowledge Distillation	—Unverified	0
STKDRec: Spatial-Temporal Knowledge Distillation for Takeaway Recommendation	Dec 21, 2024	Knowledge DistillationKnowledge Graphs	CodeCode Available	0
LiRCDepth: Lightweight Radar-Camera Depth Estimation via Knowledge Distillation and Uncertainty Guidance	Dec 20, 2024	Computational EfficiencyDepth Estimation	CodeCode Available	1
BabyHGRN: Exploring RNNs for Sample-Efficient Training of Language Models	Dec 20, 2024	Knowledge DistillationLanguage Modeling	—Unverified	0
A New Method to Capturing Compositional Knowledge in Linguistic Space	Dec 20, 2024	Image RetrievalKnowledge Distillation	—Unverified	0
Efficient Fine-Tuning and Concept Suppression for Pruned Diffusion Models	Dec 19, 2024	Bilevel OptimizationKnowledge Distillation	CodeCode Available	1
Uncertainty-Guided Cross Attention Ensemble Mean Teacher for Semi-supervised Medical Image Segmentation	Dec 19, 2024	Domain GeneralizationImage Segmentation	CodeCode Available	0
Self-Evolution Knowledge Distillation for LLM-based Machine Translation	Dec 19, 2024	Knowledge DistillationMachine Translation	—Unverified	0
Multi-Level Optimal Transport for Universal Cross-Tokenizer Knowledge Distillation on Language Models	Dec 19, 2024	Knowledge Distillation	CodeCode Available	1

Show:10 25 50

← PrevPage 9 of 85Next →

All datasets ImageNet CIFAR-100 COCO (Common Objects in Context)COCO 2017 val PASCAL VOC KITTI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ScaleKD (T:BEiT-L S:ViT-B/14)	Top-1 accuracy %	86.43	—	Unverified
2	ScaleKD (T:Swin-L S:ViT-B/16)	Top-1 accuracy %	85.53	—	Unverified
3	ScaleKD (T:Swin-L S:ViT-S/16)	Top-1 accuracy %	83.93	—	Unverified
4	ScaleKD (T:Swin-L S:Swin-T)	Top-1 accuracy %	83.8	—	Unverified
5	KD++(T: regnety-16GF S:ViT-B)	Top-1 accuracy %	83.6	—	Unverified
6	VkD (T:RegNety 160 S:DeiT-S)	Top-1 accuracy %	82.9	—	Unverified
7	SpectralKD (T:Swin-S S:Swin-T)	Top-1 accuracy %	82.7	—	Unverified
8	ScaleKD (T:Swin-L S:ResNet-50)	Top-1 accuracy %	82.55	—	Unverified
9	DiffKD (T:Swin-L S: Swin-T)	Top-1 accuracy %	82.5	—	Unverified
10	DIST (T: Swin-L S: Swin-T)	Top-1 accuracy %	82.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SRD (T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	79.86	—	Unverified
2	shufflenet-v2(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	78.76	—	Unverified
3	MV-MR (T: CLIP/ViT-B-16 S: resnet50)	Top-1 Accuracy (%)	78.6	—	Unverified
4	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	78.28	—	Unverified
5	resnet8x4 (T: resnet32x4 S: resnet8x4 [modified])	Top-1 Accuracy (%)	78.08	—	Unverified
6	ReviewKD++(T:resnet-32x4, S:shufflenet-v2)	Top-1 Accuracy (%)	77.93	—	Unverified
7	ReviewKD++(T:resnet-32x4, S:shufflenet-v1)	Top-1 Accuracy (%)	77.68	—	Unverified
8	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	77.5	—	Unverified
9	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.68	—	Unverified
10	resnet8x4 (T: resnet32x4 S: resnet8x4)	Top-1 Accuracy (%)	76.31	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	77.16	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	73.73	—	Unverified
3	ADLIK-Faster (T: Faster R-CNN vit-base S: Faster R-CNN deit-small)	box AP	47.6	—	Unverified
4	ADLIK-Mask (T: Mask R-CNN vit-base S: Mask R-CNN deit-small)	mask AP	42.4	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet50))	AP@0.5	61.8	—	Unverified
2	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(resnet18))	AP@0.5	57.96	—	Unverified
3	ReviewKD++(T: faster rcnn(resnet101), S:faster rcnn(mobilenet-v2))	AP@0.5	55.18	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	LSHFM (T: ResNet101 S: ResNet50)	mAP	93.17	—	Unverified
2	LSHFM (T: ResNet101 S: MobileNetV2)	mAP	90.14	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TIE-KD (T: Adabins S: MobileNetV2)	RMSE	2.43	—	Unverified