Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 376–400 of 1356 papers

Title	Date	Tasks	Status
DipSVD: Dual-importance Protected SVD for Efficient LLM Compression	Jun 25, 2025	Model CompressionQuantization	—Unverified
DEEPEYE: A Compact and Accurate Video Comprehension at Terminal Devices Compressed with Quantization and Tensorization	May 21, 2018	Action RecognitionGeneral Classification	—Unverified
Discrete Model Compression With Resource Constraint for Deep Neural Networks	Jun 1, 2020	Model Compression	—Unverified
Activation Density based Mixed-Precision Quantization for Energy Efficient Neural Networks	Jan 12, 2021	Model CompressionQuantization	—Unverified
ECoFLaP: Efficient Coarse-to-Fine Layer-Wise Pruning for Vision-Language Models	Oct 4, 2023	Model Compression	—Unverified
Automatic Mixed-Precision Quantization Search of BERT	Dec 30, 2021	Knowledge DistillationModel Compression	—Unverified
Deep Compression of Neural Networks for Fault Detection on Tennessee Eastman Chemical Processes	Jan 18, 2021	ClusteringFault Detection	—Unverified
Automatic Mapping of the Best-Suited DNN Pruning Schemes for Real-Time Mobile Acceleration	Nov 22, 2021	Model Compression	—Unverified
Deep Collective Knowledge Distillation	Apr 18, 2023	Knowledge DistillationModel Compression	—Unverified
An Effective Information Theoretic Framework for Channel Pruning	Aug 14, 2024	Model Compression	—Unverified
Distilling Inductive Bias: Knowledge Distillation Beyond Model Compression	Sep 30, 2023	Inductive BiasKnowledge Distillation	—Unverified
MobiSR: Efficient On-Device Super-Resolution through Heterogeneous Mobile Processors	Aug 21, 2019	Cloud ComputingImage Restoration	—Unverified
BioNetExplorer: Architecture-Space Exploration of Bio-Signal Processing Deep Neural Networks for Wearables	Sep 7, 2021	Model Compression	—Unverified
EDCompress: Energy-Aware Model Compression for Dataflows	Jun 8, 2020	Diversitymodel	—Unverified
Edge Deep Learning for Neural Implants	Dec 1, 2020	Deep LearningEEG	—Unverified
Decoupling Weight Regularization from Batch Size for Model Compression	Sep 25, 2019	Model Compression	—Unverified
Distilling Spikes: Knowledge Distillation in Spiking Neural Networks	May 1, 2020	image-classificationImage Classification	—Unverified
Distilling with Performance Enhanced Students	Oct 24, 2018	Model Compression	—Unverified
Distributed Low Precision Training Without Mixed Precision	Nov 18, 2019	GPUModel Compression	—Unverified
Divergent Token Metrics: Measuring degradation to prune away LLM components -- and optimize quantization	Nov 2, 2023	ManagementModel Compression	—Unverified
DKM: Differentiable K-Means Clustering Layer for Neural Network Compression	Aug 28, 2021	ClusteringModel Compression	—Unverified
DLIP: Distilling Language-Image Pre-training	Aug 24, 2023	Image CaptioningImage-text Retrieval	—Unverified
DMT: Comprehensive Distillation with Multiple Self-supervised Teachers	Dec 19, 2023	Contrastive LearningModel Compression	—Unverified
DNA data storage, sequencing data-carrying DNA	May 11, 2022	Model Compression	—Unverified
Debiased Distillation by Transplanting the Last Layer	Feb 22, 2023	AttributeKnowledge Distillation	—Unverified

Show:10 25 50

← PrevPage 16 of 55Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified