Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 851–900 of 1356 papers

Title	Date	Tasks	Status	Hype
Data-Free Knowledge Distillation for Image Super-Resolution	Jun 19, 2021	Data-free Knowledge DistillationImage Super-Resolution	CodeCode Available	0
Quantized Neural Networks via -1, +1 Encoding Decomposition and Acceleration	Jun 18, 2021	image-classificationImage Classification	CodeCode Available	0
How does topology of neural architectures impact gradient propagation and model performance?	Jun 16, 2021	Model CompressionNeural Architecture Search	CodeCode Available	0
Efficient Deep Learning: A Survey on Making Deep Learning Models Smaller, Faster, and Better	Jun 16, 2021	Deep LearningInformation Retrieval	CodeCode Available	1
Topology Distillation for Recommender System	Jun 16, 2021	Knowledge DistillationModel Compression	—Unverified	0
Masked Training of Neural Networks with Partial Gradients	Jun 16, 2021	Model Compression	—Unverified	0
A Winning Hand: Compressing Deep Networks Can Improve Out-Of-Distribution Robustness	Jun 16, 2021	Data AugmentationModel Compression	CodeCode Available	1
Energy-efficient Knowledge Distillation for Spiking Neural Networks	Jun 14, 2021	Knowledge DistillationModel Compression	—Unverified	0
Heterogeneous Federated Learning using Dynamic Model Pruning and Adaptive Gradient	Jun 13, 2021	Federated LearningModel Compression	—Unverified	0
ModelDiff: Testing-Based DNN Similarity Comparison for Model Reuse Detection	Jun 11, 2021	Deep LearningModel Compression	CodeCode Available	1
FedNILM: Applying Federated Learning to NILM Applications at the Edge	Jun 7, 2021	Federated LearningModel Compression	—Unverified	0
FedNL: Making Newton-Type Methods Applicable to Federated Learning	Jun 5, 2021	Federated LearningModel Compression	—Unverified	0
Feature Flow Regularization: Improving Structured Sparsity in Deep Neural Networks	Jun 5, 2021	Model Compression	—Unverified	0
Bidirectional Distillation for Top-K Recommender System	Jun 5, 2021	Knowledge DistillationModel Compression	CodeCode Available	1
You Only Compress Once: Towards Effective and Elastic BERT Compression via Exploit-Explore Stochastic Nature Gradient	Jun 4, 2021	AutoMLModel Compression	CodeCode Available	1
Enabling Lightweight Fine-tuning for Pre-trained Language Model Compression based on Matrix Product Operators	Jun 4, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
One Teacher is Enough? Pre-trained Language Model Distillation from Multiple Teachers	Jun 2, 2021	Knowledge DistillationLanguage Modeling	—Unverified	0
Energy-Efficient Model Compression and Splitting for Collaborative Inference Over Time-Varying Channels	Jun 2, 2021	Collaborative Inferenceimage-classification	—Unverified	0
On Attention Redundancy: A Comprehensive Study	Jun 1, 2021	Model CompressionSentence	—Unverified	0
NAS-BERT: Task-Agnostic and Adaptive-Size BERT Compression with Neural Architecture Search	May 30, 2021	Language ModellingModel Compression	—Unverified	0
Towards Efficient Full 8-bit Integer DNN Online Training on Resource-limited Devices without Batch Normalization	May 27, 2021	Model CompressionQuantization	—Unverified	0
Super Tickets in Pre-Trained Language Models: From Model Compression to Improving Generalization	May 25, 2021	Model CompressionMulti-Task Learning	CodeCode Available	1
Differentiable Sparsification for Deep Neural Networks	May 21, 2021	Feature EngineeringModel Compression	—Unverified	0
Model Compression	May 20, 2021	BIG-bench Machine Learningmodel	—Unverified	0
How to Explain Neural Networks: an Approximation Perspective	May 17, 2021	Model Compression	—Unverified	0
Clustered Sampling: Low-Variance and Improved Representativity for Clients Selection in Federated Learning	May 12, 2021	ClusteringFederated Learning	CodeCode Available	1
3U-EdgeAI: Ultra-Low Memory Training, Ultra-Low BitwidthQuantization, and Ultra-Low Latency Acceleration	May 11, 2021	Model CompressionQuantization	—Unverified	0
Test-Time Adaptation Toward Personalized Speech Enhancement: Zero-Shot Learning with Knowledge Distillation	May 8, 2021	DenoisingKnowledge Distillation	—Unverified	0
Neural 3D Scene Compression via Model Compression	May 7, 2021	Image Compressionmodel	—Unverified	0
Encoding Weights of Irregular Sparsity for Fixed-to-Fixed Model Compression	May 5, 2021	Model Compression	—Unverified	0
Modulating Regularization Frequency for Efficient Compression-Aware Model Training	May 5, 2021	Model Compression	—Unverified	0
Initialization and Regularization of Factorized Neural Layers	May 3, 2021	Knowledge DistillationModel Compression	CodeCode Available	1
Knowledge Distillation for Swedish NER models: A Search for Performance and Efficiency	May 1, 2021	Knowledge DistillationModel Compression	—Unverified	0
On the Adversarial Robustness of Quantized Neural Networks	May 1, 2021	Adversarial RobustnessModel Compression	—Unverified	0
Stealthy Backdoors as Compression Artifacts	Apr 30, 2021	Backdoor AttackModel Compression	CodeCode Available	0
Spirit Distillation: A Model Compression Method with Multi-domain Knowledge Transfer	Apr 29, 2021	General KnowledgeKnowledge Distillation	—Unverified	0
Spatio-Temporal Pruning and Quantization for Low-latency Spiking Neural Networks	Apr 26, 2021	Model CompressionQuantization	—Unverified	0
Skip-Convolutions for Efficient Video Processing	Apr 23, 2021	Model Compression	CodeCode Available	1
Knowledge Distillation as Semiparametric Inference	Apr 20, 2021	Knowledge DistillationModel Compression	CodeCode Available	0
Differentiable Model Compression via Pseudo Quantization Noise	Apr 20, 2021	Audio Source Separationimage-classification	CodeCode Available	1
Compact CNN Structure Learning by Knowledge Distillation	Apr 19, 2021	Knowledge DistillationModel Compression	—Unverified	0
Augmenting Deep Classifiers with Polynomial Neural Networks	Apr 16, 2021	Audio ClassificationGeneral Classification	CodeCode Available	0
Annealing Knowledge Distillation	Apr 14, 2021	image-classificationImage Classification	CodeCode Available	0
Dual Discriminator Adversarial Distillation for Data-free Model Compression	Apr 12, 2021	Data-free Knowledge DistillationKnowledge Distillation	—Unverified	0
Reversible Watermarking in Deep Convolutional Neural Networks for Integrity Authentication	Apr 9, 2021	Model Compression	—Unverified	0
Efficient Personalized Speech Enhancement through Self-Supervised Learning	Apr 5, 2021	Few-Shot LearningModel Compression	—Unverified	0
Model Compression for Dynamic Forecast Combination	Apr 5, 2021	modelModel Compression	CodeCode Available	0
Tight Compression: Compressing CNN Through Fine-Grained Pruning and Weight Permutation for Efficient Implementation	Apr 3, 2021	Model Compression	—Unverified	0
Deep Compression for PyTorch Model Deployment on Microcontrollers	Mar 29, 2021	modelModel Compression	CodeCode Available	1
Shrinking Bigfoot: Reducing wav2vec 2.0 footprint	Mar 29, 2021	Model Compressionspeech-recognition	—Unverified	0

Show:10 25 50

← PrevPage 18 of 28Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified