Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 141–150 of 1356 papers

Title	Date	Tasks	Status	Hype	Score
FIMA-Q: Post-Training Quantization for Vision Transformers by Fisher Information Matrix Approximation	Jun 13, 2025	Model CompressionQuantization	CodeCode Available	1	5
BERT-of-Theseus: Compressing BERT by Progressive Module Replacing	Feb 7, 2020	Knowledge DistillationModel Compression	CodeCode Available	1	5
Clustered Sampling: Low-Variance and Improved Representativity for Clients Selection in Federated Learning	May 12, 2021	ClusteringFederated Learning	CodeCode Available	1	5
Model LEGO: Creating Models Like Disassembling and Assembling Building Blocks	Mar 25, 2022	Incremental LearningKnowledge Distillation	CodeCode Available	1	5
COMCAT: Towards Efficient Compression and Customization of Attention-Based Vision Models	May 26, 2023	Model Compression	CodeCode Available	1	5
Communication-Computation Trade-Off in Resource-Constrained Edge Inference	Jun 3, 2020	Edge-computingModel Compression	CodeCode Available	1	5
EvoPress: Towards Optimal Dynamic Model Compression via Evolutionary Search	Oct 18, 2024	Model CompressionQuantization	CodeCode Available	1	5
Enabling Lightweight Fine-tuning for Pre-trained Language Model Compression based on Matrix Product Operators	Jun 4, 2021	Language ModelingLanguage Modelling	CodeCode Available	1	5
Compacting, Picking and Growing for Unforgetting Continual Learning	Oct 15, 2019	Age And Gender ClassificationContinual Learning	CodeCode Available	1	5
A Unified Pruning Framework for Vision Transformers	Nov 30, 2021	Model Compressionobject-detection	CodeCode Available	1	5

Show:10 25 50

← PrevPage 15 of 136Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified