Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1326–1350 of 1356 papers

Title	Date	Tasks	Status	Hype
DeepRebirth: Accelerating Deep Neural Network Execution on Mobile Devices	Aug 16, 2017	CPUModel Compression	—Unverified	0
Model compression as constrained optimization, with application to neural nets. Part II: quantization	Jul 13, 2017	BinarizationModel Compression	—Unverified	0
Model compression as constrained optimization, with application to neural nets. Part I: general framework	Jul 5, 2017	Model CompressionObject Recognition	—Unverified	0
DarkRank: Accelerating Deep Metric Learning via Cross Sample Similarities Transfer	Jul 5, 2017	ClusteringImage Clustering	—Unverified	0
Tensor Contraction Layers for Parsimonious Deep Nets	Jun 1, 2017	Model Compression	—Unverified	0
Cross-lingual Distillation for Text Classification	May 5, 2017	ClassificationGeneral Classification	CodeCode Available	0
Acoustic Model Compression with MAP adaptation	May 1, 2017	Automatic Speech Recognition (ASR)model	—Unverified	0
Exploiting random projections and sparsity with random forests and gradient boosting methods -- Application to multi-label and multi-output learning, random forest model compression and leveraging input sparsity	Apr 26, 2017	Model Compression	—Unverified	0
A Compact DNN: Approaching GoogLeNet-Level Accuracy of Classification and Domain Adaptation	Mar 12, 2017	ClassificationDomain Adaptation	—Unverified	0
Exploiting Domain Knowledge via Grouped Weight Sharing with Application to Text Categorization	Feb 8, 2017	General ClassificationModel Compression	—Unverified	0
Compression of Deep Neural Networks for Image Instance Retrieval	Jan 18, 2017	Image Instance RetrievalModel Compression	—Unverified	0
QuickNet: Maximizing Efficiency and Efficacy in Deep Architectures	Jan 9, 2017	Model Compression	—Unverified	0
Two-Bit Networks for Deep Learning on Resource-Constrained Embedded Devices	Jan 2, 2017	Computational EfficiencyGeneral Classification	—Unverified	0
Parameter Compression of Recurrent Neural Networks and Degradation of Short-term Memory	Dec 2, 2016	MemorizationModel Compression	—Unverified	0
The Shallow End: Empowering Shallower Deep-Convolutional Networks through Auxiliary Outputs	Nov 6, 2016	Model CompressionModel Selection	CodeCode Available	0
Deep Model Compression: Distilling Knowledge from Noisy Teachers	Oct 30, 2016	Model Compression	—Unverified	0
Ensemble-Compression: A New Method for Parallel Training of Deep Neural Networks	Jun 2, 2016	Model Compression	—Unverified	0
Ternary Weight Networks	May 16, 2016	Model Compressionobject-detection	CodeCode Available	1
Adapting Models to Signal Degradation using Distillation	Apr 1, 2016	Domain AdaptationKnowledge Distillation	—Unverified	0
On the Compression of Recurrent Neural Networks with an Application to LVCSR acoustic modeling for Embedded Speech Recognition	Mar 25, 2016	Model Compressionspeech-recognition	—Unverified	0
SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and <0.5MB model size	Feb 24, 2016	Image ClassificationModel Compression	CodeCode Available	1
Actor-Mimic: Deep Multitask and Transfer Reinforcement Learning	Nov 19, 2015	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
Blending LSTMs into CNNs	Nov 19, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Distilling Model Knowledge	Oct 8, 2015	Bayesian InferenceBIG-bench Machine Learning	CodeCode Available	0
DeepFont: Identify Your Font from An Image	Jul 12, 2015	Domain AdaptationFont Recognition	CodeCode Available	0

Show:10 25 50

← PrevPage 54 of 55Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified