Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1301–1350 of 1356 papers

Title	Date	Tasks	Status
Multi-Task Zipping via Layer-wise Neuron Sharing	May 24, 2018	Model Compression	—Unverified
DEEPEYE: A Compact and Accurate Video Comprehension at Terminal Devices Compressed with Quantization and Tensorization	May 21, 2018	Action RecognitionGeneral Classification	—Unverified
Precise Box Score: Extract More Information from Datasets to Improve the Performance of Face Detection	Apr 28, 2018	Face DetectionModel Compression	—Unverified
Developing Far-Field Speaker System Via Teacher-Student Learning	Apr 14, 2018	Keyword SpottingModel Compression	—Unverified
Hybrid Binary Networks: Optimizing for Accuracy, Efficiency and Memory	Apr 11, 2018	BinarizationModel Compression	CodeCode Available
Efficient Recurrent Neural Networks using Structured Matrices in FPGAs	Mar 20, 2018	Model CompressionTime Series	—Unverified
Interpreting Deep Classifier by Visual Distillation of Dark Knowledge	Mar 11, 2018	Dimensionality ReductionModel Compression	—Unverified
Model compression via distillation and quantization	Feb 15, 2018	image-classificationmodel	CodeCode Available
Paraphrasing Complex Network: Network Compression via Factor Transfer	Feb 14, 2018	Model CompressionTransfer Learning	CodeCode Available
Model compression for faster structural separation of macromolecules captured by Cellular Electron Cryo-Tomography	Jan 31, 2018	ClassificationGeneral Classification	—Unverified
Don't encrypt the data; just approximate the model \ Towards Secure Transaction and Fair Pricing of Training Data	Jan 1, 2018	Federated LearningModel Compression	—Unverified
DNN Model Compression Under Accuracy Constraints	Jan 1, 2018	modelModel Compression	—Unverified
Adaptive Quantization of Neural Networks	Jan 1, 2018	Edge-computingModel Compression	—Unverified
Learning Deep and Compact Models for Gesture Recognition	Dec 29, 2017	Gesture RecognitionKnowledge Distillation	CodeCode Available
StrassenNets: Deep Learning with a Multiplication Budget	Dec 11, 2017	Deep Learningimage-classification	CodeCode Available
Neural Regularized Domain Adaptation for Chinese Word Segmentation	Dec 1, 2017	Chinese Word SegmentationDomain Adaptation	—Unverified
Learning Efficient Object Detection Models with Knowledge Distillation	Dec 1, 2017	Knowledge DistillationModel Compression	—Unverified
MicroExpNet: An Extremely Small and Fast Model For Expression Recognition From Face Images	Nov 19, 2017	CPUFacial Expression Recognition	CodeCode Available
Improved Bayesian Compression	Nov 17, 2017	Model Compression	—Unverified
Apprentice: Using Knowledge Distillation Techniques To Improve Low-Precision Network Accuracy	Nov 15, 2017	image-classificationImage Classification	—Unverified
Weightless: Lossy Weight Encoding For Deep Neural Network Compression	Nov 13, 2017	Model CompressionNeural Network Compression	CodeCode Available
A Survey of Model Compression and Acceleration for Deep Neural Networks	Oct 23, 2017	BenchmarkingKnowledge Distillation	—Unverified
Compressing Low Precision Deep Neural Networks Using Sparsity-Induced Regularization in Ternary Networks	Sep 19, 2017	L2 RegularizationModel Compression	—Unverified
N2N Learning: Network to Network Compression via Policy Gradient Reinforcement Learning	Sep 18, 2017	Model Compressionreinforcement-learning	—Unverified
Learning Intrinsic Sparse Structures within Long Short-Term Memory	Sep 15, 2017	Language ModelingLanguage Modelling	CodeCode Available
A Deep Cascade Network for Unaligned Face Attribute Classification	Sep 12, 2017	AttributeClassification	—Unverified
Model Distillation with Knowledge Transfer from Face Classification to Alignment and Verification	Sep 9, 2017	ClassificationFace Recognition	—Unverified
DeepRebirth: Accelerating Deep Neural Network Execution on Mobile Devices	Aug 16, 2017	CPUModel Compression	—Unverified
Model compression as constrained optimization, with application to neural nets. Part II: quantization	Jul 13, 2017	BinarizationModel Compression	—Unverified
Model compression as constrained optimization, with application to neural nets. Part I: general framework	Jul 5, 2017	Model CompressionObject Recognition	—Unverified
DarkRank: Accelerating Deep Metric Learning via Cross Sample Similarities Transfer	Jul 5, 2017	ClusteringImage Clustering	—Unverified
Tensor Contraction Layers for Parsimonious Deep Nets	Jun 1, 2017	Model Compression	—Unverified
Cross-lingual Distillation for Text Classification	May 5, 2017	ClassificationGeneral Classification	CodeCode Available
Acoustic Model Compression with MAP adaptation	May 1, 2017	Automatic Speech Recognition (ASR)model	—Unverified
Exploiting random projections and sparsity with random forests and gradient boosting methods -- Application to multi-label and multi-output learning, random forest model compression and leveraging input sparsity	Apr 26, 2017	Model Compression	—Unverified
A Compact DNN: Approaching GoogLeNet-Level Accuracy of Classification and Domain Adaptation	Mar 12, 2017	ClassificationDomain Adaptation	—Unverified
Exploiting Domain Knowledge via Grouped Weight Sharing with Application to Text Categorization	Feb 8, 2017	General ClassificationModel Compression	—Unverified
Compression of Deep Neural Networks for Image Instance Retrieval	Jan 18, 2017	Image Instance RetrievalModel Compression	—Unverified
QuickNet: Maximizing Efficiency and Efficacy in Deep Architectures	Jan 9, 2017	Model Compression	—Unverified
Two-Bit Networks for Deep Learning on Resource-Constrained Embedded Devices	Jan 2, 2017	Computational EfficiencyGeneral Classification	—Unverified
Parameter Compression of Recurrent Neural Networks and Degradation of Short-term Memory	Dec 2, 2016	MemorizationModel Compression	—Unverified
The Shallow End: Empowering Shallower Deep-Convolutional Networks through Auxiliary Outputs	Nov 6, 2016	Model CompressionModel Selection	CodeCode Available
Deep Model Compression: Distilling Knowledge from Noisy Teachers	Oct 30, 2016	Model Compression	—Unverified
Ensemble-Compression: A New Method for Parallel Training of Deep Neural Networks	Jun 2, 2016	Model Compression	—Unverified
Adapting Models to Signal Degradation using Distillation	Apr 1, 2016	Domain AdaptationKnowledge Distillation	—Unverified
On the Compression of Recurrent Neural Networks with an Application to LVCSR acoustic modeling for Embedded Speech Recognition	Mar 25, 2016	Model Compressionspeech-recognition	—Unverified
Actor-Mimic: Deep Multitask and Transfer Reinforcement Learning	Nov 19, 2015	Atari GamesDeep Reinforcement Learning	CodeCode Available
Blending LSTMs into CNNs	Nov 19, 2015	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Distilling Model Knowledge	Oct 8, 2015	Bayesian InferenceBIG-bench Machine Learning	CodeCode Available
DeepFont: Identify Your Font from An Image	Jul 12, 2015	Domain AdaptationFont Recognition	CodeCode Available

Show:10 25 50

← PrevPage 27 of 28Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified