Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 926–950 of 1356 papers

Title	Date	Tasks	Status	Hype
Differential Privacy Meets Federated Learning under Communication Constraints	Jan 28, 2021	Federated LearningModel Compression	—Unverified	0
Collaborative Teacher-Student Learning via Multiple Knowledge Transfer	Jan 21, 2021	Knowledge DistillationModel Compression	—Unverified	0
Deep Compression of Neural Networks for Fault Detection on Tennessee Eastman Chemical Processes	Jan 18, 2021	ClusteringFault Detection	—Unverified	0
Model Compression for Domain Adaptation through Causal Effect Estimation	Jan 18, 2021	Domain AdaptationModel Compression	CodeCode Available	0
Single-path Bit Sharing for Automatic Loss-aware Model Compression	Jan 13, 2021	Model CompressionNetwork Pruning	—Unverified	0
Fast convolutional neural networks on FPGAs with hls4ml	Jan 13, 2021	Model CompressionQuantization	CodeCode Available	2
Activation Density based Mixed-Precision Quantization for Energy Efficient Neural Networks	Jan 12, 2021	Model CompressionQuantization	—Unverified	0
Adversarially Robust and Explainable Model Compression with On-Device Personalization for Text Classification	Jan 10, 2021	Adversarial RobustnessGeneral Classification	—Unverified	0
On-Device Document Classification using multimodal features	Jan 6, 2021	ClassificationDocument Classification	—Unverified	0
Improving Neural Network Efficiency via Post-Training Quantization With Adaptive Floating-Point	Jan 1, 2021	Model CompressionQuantization	CodeCode Available	1
Exploration and Estimation for Model Compression	Jan 1, 2021	modelModel Compression	—Unverified	0
Improve Object Detection with Feature-based Knowledge Distillation: Towards Accurate and Efficient Detectors	Jan 1, 2021	image-classificationImage Classification	CodeCode Available	1
Model Compression via Hyper-Structure Network	Jan 1, 2021	modelModel Compression	—Unverified	0
Knowledge distillation via softmax regression representation learning	Jan 1, 2021	Knowledge DistillationModel Compression	—Unverified	0
Post-Training Weighted Quantization of Neural Networks for Language Models	Jan 1, 2021	Model CompressionQuantization	—Unverified	0
Task-Agnostic and Adaptive-Size BERT Compression	Jan 1, 2021	Language ModellingModel Compression	—Unverified	0
Can Students Outperform Teachers in Knowledge Distillation based Model Compression?	Jan 1, 2021	Knowledge DistillationModel Compression	—Unverified	0
SACoD: Sensor Algorithm Co-Design Towards Efficient CNN-powered Intelligent PhlatCam	Jan 1, 2021	BenchmarkingModel Compression	CodeCode Available	0
Block Skim Transformer for Efficient Question Answering	Jan 1, 2021	Language ModelingLanguage Modelling	—Unverified	0
A Half-Space Stochastic Projected Gradient Method for Group Sparsity Regularization	Jan 1, 2021	compressed sensingfeature selection	—Unverified	0
TwinDNN: A Tale of Two Deep Neural Networks	Jan 1, 2021	image-classificationImage Classification	—Unverified	0
Dynamic Probabilistic Pruning: Training sparse networks based on stochastic and dynamic masking	Jan 1, 2021	Model Compression	—Unverified	0
EarlyBERT: Efficient BERT Training via Early-bird Lottery Tickets	Dec 31, 2020	Model Compression	CodeCode Available	1
BinaryBERT: Pushing the Limit of BERT Quantization	Dec 31, 2020	BinarizationModel Compression	—Unverified	0
Towards Zero-Shot Knowledge Distillation for Natural Language Processing	Dec 31, 2020	Knowledge DistillationModel Compression	—Unverified	0

Show:10 25 50

← PrevPage 38 of 55Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified