Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 176–200 of 1356 papers

Title	Date	Tasks	Status	Hype
Learned Step Size Quantization	Feb 21, 2019	Model CompressionQuantization	CodeCode Available	1
Contrastive Distillation on Intermediate Representations for Language Model Compression	Sep 29, 2020	Knowledge DistillationLanguage Modeling	CodeCode Available	1
Basis Sharing: Cross-Layer Parameter Sharing for Large Language Model Compression	Oct 2, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
Comprehensive Knowledge Distillation with Causal Intervention	Dec 1, 2021	Causal InferenceKnowledge Distillation	CodeCode Available	1
Composable Interventions for Language Models	Jul 9, 2024	knowledge editingMachine Unlearning	CodeCode Available	1
LiMuSE: Lightweight Multi-modal Speaker Extraction	Nov 7, 2021	Model CompressionQuantization	CodeCode Available	1
LiteYOLO-ID: A Lightweight Object Detection Network for Insulator Defect Detection	Jun 24, 2024	Defect DetectionInsulator Defect Detection	CodeCode Available	1
"Lossless" Compression of Deep Neural Networks: A High-dimensional Neural Tangent Kernel Approach	Mar 1, 2024	Model CompressionQuantization	CodeCode Available	1
BERT-EMD: Many-to-Many Layer Mapping for BERT Compression with Earth Mover's Distance	Oct 13, 2020	Model Compression	CodeCode Available	1
Streamlining Redundant Layers to Compress Large Language Models	Mar 28, 2024	Model Compression	CodeCode Available	1
Masking Adversarial Damage: Finding Adversarial Saliency for Robust and Sparse Network	Apr 6, 2022	Adversarial RobustnessModel Compression	CodeCode Available	1
Merging Feed-Forward Sublayers for Compressed Transformers	Jan 10, 2025	image-classificationImage Classification	CodeCode Available	1
DUET: A Tuning-Free Device-Cloud Collaborative Parameters Generation Framework for Efficient Device Model Generalization	Sep 12, 2022	Device-Cloud CollaborationDomain Adaptation	CodeCode Available	1
Compacting, Picking and Growing for Unforgetting Continual Learning	Oct 15, 2019	Age And Gender ClassificationContinual Learning	CodeCode Available	1
Bidirectional Distillation for Top-K Recommender System	Jun 5, 2021	Knowledge DistillationModel Compression	CodeCode Available	1
Contrastive Representation Distillation	Oct 23, 2019	Contrastive LearningKnowledge Distillation	CodeCode Available	1
DiSparse: Disentangled Sparsification for Multitask Model Compression	Jun 9, 2022	modelModel Compression	CodeCode Available	1
Optimal Brain Compression: A Framework for Accurate Post-Training Quantization and Pruning	Aug 24, 2022	Model CompressionQuantization	CodeCode Available	1
Bit-mask Robust Contrastive Knowledge Distillation for Unsupervised Semantic Hashing	Mar 10, 2024	Image RetrievalKnowledge Distillation	CodeCode Available	1
An Efficient Multilingual Language Model Compression through Vocabulary Trimming	May 24, 2023	Language ModelingLanguage Modelling	CodeCode Available	1
Passport-aware Normalization for Deep Model Protection	Oct 29, 2020	modelModel Compression	CodeCode Available	1
Performance-aware Approximation of Global Channel Pruning for Multitask CNNs	Mar 21, 2023	Model Compression	CodeCode Available	1
Pixel Distillation: A New Knowledge Distillation Scheme for Low-Resolution Image Recognition	Dec 17, 2021	image-classificationImage Classification	CodeCode Available	1
Clustered Sampling: Low-Variance and Improved Representativity for Clients Selection in Federated Learning	May 12, 2021	ClusteringFederated Learning	CodeCode Available	1
Gaussian RAM: Lightweight Image Classification via Stochastic Retina-Inspired Glimpse and Reinforcement Learning	Nov 12, 2020	ClassificationGeneral Classification	CodeCode Available	1

Show:10 25 50

← PrevPage 8 of 55Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified