Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 951–1000 of 1356 papers

Title	Date	Tasks	Status
Modulating Regularization Frequency for Efficient Compression-Aware Model Training	May 5, 2021	Model Compression	—Unverified
Encoding Weights of Irregular Sparsity for Fixed-to-Fixed Model Compression	May 5, 2021	Model Compression	—Unverified
On the Adversarial Robustness of Quantized Neural Networks	May 1, 2021	Adversarial RobustnessModel Compression	—Unverified
Knowledge Distillation for Swedish NER models: A Search for Performance and Efficiency	May 1, 2021	Knowledge DistillationModel Compression	—Unverified
Stealthy Backdoors as Compression Artifacts	Apr 30, 2021	Backdoor AttackModel Compression	CodeCode Available
Spirit Distillation: A Model Compression Method with Multi-domain Knowledge Transfer	Apr 29, 2021	General KnowledgeKnowledge Distillation	—Unverified
Spatio-Temporal Pruning and Quantization for Low-latency Spiking Neural Networks	Apr 26, 2021	Model CompressionQuantization	—Unverified
Knowledge Distillation as Semiparametric Inference	Apr 20, 2021	Knowledge DistillationModel Compression	CodeCode Available
Compact CNN Structure Learning by Knowledge Distillation	Apr 19, 2021	Knowledge DistillationModel Compression	—Unverified
Augmenting Deep Classifiers with Polynomial Neural Networks	Apr 16, 2021	Audio ClassificationGeneral Classification	CodeCode Available
Annealing Knowledge Distillation	Apr 14, 2021	image-classificationImage Classification	CodeCode Available
Dual Discriminator Adversarial Distillation for Data-free Model Compression	Apr 12, 2021	Data-free Knowledge DistillationKnowledge Distillation	—Unverified
Reversible Watermarking in Deep Convolutional Neural Networks for Integrity Authentication	Apr 9, 2021	Model Compression	—Unverified
Model Compression for Dynamic Forecast Combination	Apr 5, 2021	modelModel Compression	CodeCode Available
Efficient Personalized Speech Enhancement through Self-Supervised Learning	Apr 5, 2021	Few-Shot LearningModel Compression	—Unverified
Tight Compression: Compressing CNN Through Fine-Grained Pruning and Weight Permutation for Efficient Implementation	Apr 3, 2021	Model Compression	—Unverified
Shrinking Bigfoot: Reducing wav2vec 2.0 footprint	Mar 29, 2021	Model Compressionspeech-recognition	—Unverified
Prototype-based Personalized Pruning	Mar 25, 2021	Keyword SpottingModel Compression	—Unverified
Compacting Deep Neural Networks for Internet of Things: Methods and Applications	Mar 20, 2021	DiversityKnowledge Distillation	—Unverified
Robust Model Compression Using Deep Hypotheses	Mar 13, 2021	Binary ClassificationKnowledge Distillation	CodeCode Available
MWQ: Multiscale Wavelet Quantized Neural Networks	Mar 9, 2021	Model CompressionQuantization	—Unverified
Formalizing Generalization and Robustness of Neural Networks to Weight Perturbations	Mar 3, 2021	Model Compression	—Unverified
On the Utility of Gradient Compression in Distributed Training Systems	Feb 28, 2021	Model Compression	CodeCode Available
PURSUhInT: In Search of Informative Hint Points Based on Layer Clustering for Knowledge Distillation	Feb 26, 2021	ClusteringKnowledge Distillation	—Unverified
Preserved central model for faster bidirectional compression in distributed settings	Feb 24, 2021	Model Compression	CodeCode Available
Lottery Ticket Preserves Weight Correlation: Is It Desirable or Not?	Feb 19, 2021	Model Compression	—Unverified
Neural Network Compression for Noisy Storage Devices	Feb 15, 2021	Model CompressionNeural Network Compression	—Unverified
Robustness in Compressed Neural Networks for Object Detection	Feb 10, 2021	Autonomous DrivingData Augmentation	—Unverified
Compressed Object Detection	Feb 4, 2021	Model CompressionObject	CodeCode Available
It's always personal: Using Early Exits for Efficient On-Device CNN Personalisation	Feb 2, 2021	GPUModel Compression	—Unverified
AACP: Model Compression by Accurate and Automatic Channel Pruning	Jan 31, 2021	Model CompressionNeural Architecture Search	—Unverified
Deep Model Compression based on the Training History	Jan 30, 2021	modelModel Compression	—Unverified
AdaSpring: Context-adaptive and Runtime-evolutionary Deep Model Compression for Mobile Applications	Jan 28, 2021	Model Compression	—Unverified
Differential Privacy Meets Federated Learning under Communication Constraints	Jan 28, 2021	Federated LearningModel Compression	—Unverified
Collaborative Teacher-Student Learning via Multiple Knowledge Transfer	Jan 21, 2021	Knowledge DistillationModel Compression	—Unverified
Deep Compression of Neural Networks for Fault Detection on Tennessee Eastman Chemical Processes	Jan 18, 2021	ClusteringFault Detection	—Unverified
Model Compression for Domain Adaptation through Causal Effect Estimation	Jan 18, 2021	Domain AdaptationModel Compression	CodeCode Available
Single-path Bit Sharing for Automatic Loss-aware Model Compression	Jan 13, 2021	Model CompressionNetwork Pruning	—Unverified
Activation Density based Mixed-Precision Quantization for Energy Efficient Neural Networks	Jan 12, 2021	Model CompressionQuantization	—Unverified
Adversarially Robust and Explainable Model Compression with On-Device Personalization for Text Classification	Jan 10, 2021	Adversarial RobustnessGeneral Classification	—Unverified
On-Device Document Classification using multimodal features	Jan 6, 2021	ClassificationDocument Classification	—Unverified
Block Skim Transformer for Efficient Question Answering	Jan 1, 2021	Language ModelingLanguage Modelling	—Unverified
TwinDNN: A Tale of Two Deep Neural Networks	Jan 1, 2021	image-classificationImage Classification	—Unverified
Model Compression via Hyper-Structure Network	Jan 1, 2021	modelModel Compression	—Unverified
Can Students Outperform Teachers in Knowledge Distillation based Model Compression?	Jan 1, 2021	Knowledge DistillationModel Compression	—Unverified
Knowledge distillation via softmax regression representation learning	Jan 1, 2021	Knowledge DistillationModel Compression	—Unverified
SACoD: Sensor Algorithm Co-Design Towards Efficient CNN-powered Intelligent PhlatCam	Jan 1, 2021	BenchmarkingModel Compression	CodeCode Available
Dynamic Probabilistic Pruning: Training sparse networks based on stochastic and dynamic masking	Jan 1, 2021	Model Compression	—Unverified
Exploration and Estimation for Model Compression	Jan 1, 2021	modelModel Compression	—Unverified
Post-Training Weighted Quantization of Neural Networks for Language Models	Jan 1, 2021	Model CompressionQuantization	—Unverified

Show:10 25 50

← PrevPage 20 of 28Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified