Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 901–950 of 1356 papers

Title	Date	Tasks	Status	Hype
Prototype-based Personalized Pruning	Mar 25, 2021	Keyword SpottingModel Compression	—Unverified	0
Dynamic Slimmable Network	Mar 24, 2021	FairnessModel Compression	CodeCode Available	1
Compacting Deep Neural Networks for Internet of Things: Methods and Applications	Mar 20, 2021	DiversityKnowledge Distillation	—Unverified	0
Robust Model Compression Using Deep Hypotheses	Mar 13, 2021	Binary ClassificationKnowledge Distillation	CodeCode Available	0
MWQ: Multiscale Wavelet Quantized Neural Networks	Mar 9, 2021	Model CompressionQuantization	—Unverified	0
A Real-time Low-cost Artificial Intelligence System for Autonomous Spraying in Palm Plantations	Mar 6, 2021	Model CompressionNavigate	CodeCode Available	1
Environmental Sound Classification on the Edge: A Pipeline for Deep Acoustic Networks on Extremely Resource-Constrained Devices	Mar 5, 2021	Audio ClassificationEnvironmental Sound Classification	CodeCode Available	1
Formalizing Generalization and Robustness of Neural Networks to Weight Perturbations	Mar 3, 2021	Model Compression	—Unverified	0
General Instance Distillation for Object Detection	Mar 3, 2021	Knowledge DistillationModel Compression	CodeCode Available	1
On the Utility of Gradient Compression in Distributed Training Systems	Feb 28, 2021	Model Compression	CodeCode Available	0
PURSUhInT: In Search of Informative Hint Points Based on Layer Clustering for Knowledge Distillation	Feb 26, 2021	ClusteringKnowledge Distillation	—Unverified	0
Preserved central model for faster bidirectional compression in distributed settings	Feb 24, 2021	Model Compression	CodeCode Available	0
Lottery Ticket Preserves Weight Correlation: Is It Desirable or Not?	Feb 19, 2021	Model Compression	—Unverified	0
An Information-Theoretic Justification for Model Pruning	Feb 16, 2021	Data Compressionmodel	CodeCode Available	1
Neural Network Compression for Noisy Storage Devices	Feb 15, 2021	Model CompressionNeural Network Compression	—Unverified	0
FAT: Learning Low-Bitwidth Parametric Representation via Frequency-Aware Transformation	Feb 15, 2021	Model CompressionNeural Network Compression	CodeCode Available	1
Robustness in Compressed Neural Networks for Object Detection	Feb 10, 2021	Autonomous DrivingData Augmentation	—Unverified	0
LightSpeech: Lightweight and Fast Text to Speech with Neural Architecture Search	Feb 8, 2021	CPUModel Compression	CodeCode Available	1
Topology-Aware Network Pruning using Multi-stage Graph Embedding and Reinforcement Learning	Feb 5, 2021	Graph EmbeddingModel Compression	CodeCode Available	1
Show, Attend and Distill:Knowledge Distillation via Attention-based Feature Matching	Feb 5, 2021	General KnowledgeKnowledge Distillation	CodeCode Available	1
Compressed Object Detection	Feb 4, 2021	Model CompressionObject	CodeCode Available	0
It's always personal: Using Early Exits for Efficient On-Device CNN Personalisation	Feb 2, 2021	GPUModel Compression	—Unverified	0
AACP: Model Compression by Accurate and Automatic Channel Pruning	Jan 31, 2021	Model CompressionNeural Architecture Search	—Unverified	0
Deep Model Compression based on the Training History	Jan 30, 2021	modelModel Compression	—Unverified	0
AdaSpring: Context-adaptive and Runtime-evolutionary Deep Model Compression for Mobile Applications	Jan 28, 2021	Model Compression	—Unverified	0
Differential Privacy Meets Federated Learning under Communication Constraints	Jan 28, 2021	Federated LearningModel Compression	—Unverified	0
Collaborative Teacher-Student Learning via Multiple Knowledge Transfer	Jan 21, 2021	Knowledge DistillationModel Compression	—Unverified	0
Deep Compression of Neural Networks for Fault Detection on Tennessee Eastman Chemical Processes	Jan 18, 2021	ClusteringFault Detection	—Unverified	0
Model Compression for Domain Adaptation through Causal Effect Estimation	Jan 18, 2021	Domain AdaptationModel Compression	CodeCode Available	0
Single-path Bit Sharing for Automatic Loss-aware Model Compression	Jan 13, 2021	Model CompressionNetwork Pruning	—Unverified	0
Fast convolutional neural networks on FPGAs with hls4ml	Jan 13, 2021	Model CompressionQuantization	CodeCode Available	2
Activation Density based Mixed-Precision Quantization for Energy Efficient Neural Networks	Jan 12, 2021	Model CompressionQuantization	—Unverified	0
Adversarially Robust and Explainable Model Compression with On-Device Personalization for Text Classification	Jan 10, 2021	Adversarial RobustnessGeneral Classification	—Unverified	0
On-Device Document Classification using multimodal features	Jan 6, 2021	ClassificationDocument Classification	—Unverified	0
Improving Neural Network Efficiency via Post-Training Quantization With Adaptive Floating-Point	Jan 1, 2021	Model CompressionQuantization	CodeCode Available	1
Exploration and Estimation for Model Compression	Jan 1, 2021	modelModel Compression	—Unverified	0
Improve Object Detection with Feature-based Knowledge Distillation: Towards Accurate and Efficient Detectors	Jan 1, 2021	image-classificationImage Classification	CodeCode Available	1
Model Compression via Hyper-Structure Network	Jan 1, 2021	modelModel Compression	—Unverified	0
Knowledge distillation via softmax regression representation learning	Jan 1, 2021	Knowledge DistillationModel Compression	—Unverified	0
Post-Training Weighted Quantization of Neural Networks for Language Models	Jan 1, 2021	Model CompressionQuantization	—Unverified	0
Task-Agnostic and Adaptive-Size BERT Compression	Jan 1, 2021	Language ModellingModel Compression	—Unverified	0
Can Students Outperform Teachers in Knowledge Distillation based Model Compression?	Jan 1, 2021	Knowledge DistillationModel Compression	—Unverified	0
SACoD: Sensor Algorithm Co-Design Towards Efficient CNN-powered Intelligent PhlatCam	Jan 1, 2021	BenchmarkingModel Compression	CodeCode Available	0
Block Skim Transformer for Efficient Question Answering	Jan 1, 2021	Language ModelingLanguage Modelling	—Unverified	0
A Half-Space Stochastic Projected Gradient Method for Group Sparsity Regularization	Jan 1, 2021	compressed sensingfeature selection	—Unverified	0
TwinDNN: A Tale of Two Deep Neural Networks	Jan 1, 2021	image-classificationImage Classification	—Unverified	0
Dynamic Probabilistic Pruning: Training sparse networks based on stochastic and dynamic masking	Jan 1, 2021	Model Compression	—Unverified	0
EarlyBERT: Efficient BERT Training via Early-bird Lottery Tickets	Dec 31, 2020	Model Compression	CodeCode Available	1
BinaryBERT: Pushing the Limit of BERT Quantization	Dec 31, 2020	BinarizationModel Compression	—Unverified	0
Towards Zero-Shot Knowledge Distillation for Natural Language Processing	Dec 31, 2020	Knowledge DistillationModel Compression	—Unverified	0

Show:10 25 50

← PrevPage 19 of 28Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified