Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 591–600 of 1356 papers

Title	Date	Tasks	Status	Hype
Design and Prototyping Distributed CNN Inference Acceleration in Edge Computing	Nov 24, 2022	Distributed ComputingEdge-computing	—Unverified	0
Sparse Probabilistic Circuits via Pruning and Growing	Nov 22, 2022	Model Compression	CodeCode Available	1
Learning Low-Rank Representations for Model Compression	Nov 21, 2022	Clusteringmodel	—Unverified	0
Understanding and Improving Knowledge Distillation for Quantization-Aware Training of Large Transformer Encoders	Nov 20, 2022	Knowledge DistillationModel Compression	CodeCode Available	0
Is Smaller Always Faster? Tradeoffs in Compressing Self-Supervised Speech Transformers	Nov 17, 2022	Knowledge DistillationModel Compression	CodeCode Available	0
Edge-MultiAI: Multi-Tenancy of Latency-Sensitive Deep Learning Applications on Edge	Nov 14, 2022	ManagementModel Compression	—Unverified	0
Understanding the Role of Mixup in Knowledge Distillation: An Empirical Study	Nov 8, 2022	AttributeData Augmentation	CodeCode Available	0
XAI-BayesHAR: A novel Framework for Human Activity Recognition with Integrated Uncertainty and Shapely Values	Nov 7, 2022	Activity RecognitionExplainable Artificial Intelligence (XAI)	—Unverified	0
Model Compression for DNN-based Speaker Verification Using Weight Quantization	Oct 31, 2022	Model CompressionQuantization	—Unverified	0
GPTQ: Accurate Post-Training Quantization for Generative Pre-trained Transformers	Oct 31, 2022	GPULanguage Modelling	CodeCode Available	7

Show:10 25 50

← PrevPage 60 of 136Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified