Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 951–1000 of 1356 papers

Title	Date	Tasks	Status	Hype
Enabling Retrain-free Deep Neural Network Pruning using Surrogate Lagrangian Relaxation	Dec 18, 2020	image-classificationImage Classification	—Unverified	0
Computation-Efficient Knowledge Distillation via Uncertainty-Aware Mixup	Dec 17, 2020	InformativenessKnowledge Distillation	CodeCode Available	1
Neural Pruning via Growing Regularization	Dec 16, 2020	L2 RegularizationModel Compression	CodeCode Available	1
Provable Benefits of Overparameterization in Model Compression: From Double Descent to Pruning Neural Networks	Dec 16, 2020	Model Compression	—Unverified	0
Distilling Optimal Neural Networks: Rapid Search in Diverse Spaces	Dec 16, 2020	GPUKnowledge Distillation	—Unverified	0
Wasserstein Contrastive Representation Distillation	Dec 15, 2020	Contrastive LearningKnowledge Distillation	—Unverified	0
Reinforced Multi-Teacher Selection for Knowledge Distillation	Dec 11, 2020	GPUKnowledge Distillation	—Unverified	0
Large-Scale Generative Data-Free Distillation	Dec 10, 2020	Knowledge DistillationModel Compression	—Unverified	0
Inferring ECG from PPG for Continuous Cardiac Monitoring Using Lightweight Neural Network	Dec 9, 2020	Model Compression	—Unverified	0
Progressive Network Grafting for Few-Shot Knowledge Distillation	Dec 9, 2020	Knowledge DistillationModel Compression	CodeCode Available	1
Mix and Match: A Novel FPGA-Centric Deep Neural Network Quantization Framework	Dec 8, 2020	Edge-computingModel Compression	—Unverified	0
DE-RRD: A Knowledge Distillation Framework for Recommender System	Dec 8, 2020	Knowledge DistillationModel Compression	CodeCode Available	1
Model Compression Using Optimal Transport	Dec 7, 2020	image-classificationImage Classification	—Unverified	0
Multi-head Knowledge Distillation for Model Compression	Dec 5, 2020	image-classificationImage Classification	—Unverified	0
Going Beyond Classification Accuracy Metrics in Model Compression	Dec 3, 2020	ClassificationEdge-computing	CodeCode Available	1
Meta-KD: A Meta Knowledge Distillation Framework for Language Model Compression across Domains	Dec 2, 2020	Knowledge DistillationLanguage Modeling	—Unverified	0
Compressing Pre-trained Language Models by Matrix Decomposition	Dec 1, 2020	Model Compression	—Unverified	0
Edge Deep Learning for Neural Implants	Dec 1, 2020	Deep LearningEEG	—Unverified	0
Multi-level Knowledge Distillation via Knowledge Alignment and Correlation	Dec 1, 2020	Contrastive LearningKnowledge Distillation	CodeCode Available	1
NPAS: A Compiler-aware Framework of Unified Network Pruning and Architecture Search for Beyond Real-Time Mobile Acceleration	Dec 1, 2020	Bayesian OptimizationCode Generation	—Unverified	0
Self-Supervised Generative Adversarial Compression	Dec 1, 2020	image-classificationImage Classification	—Unverified	0
Reverse-engineering recurrent neural network solutions to a hierarchical inference task for mice	Dec 1, 2020	Knowledge DistillationModel Compression	—Unverified	0
A Selective Survey on Versatile Knowledge Distillation Paradigm for Neural Network Models	Nov 30, 2020	Knowledge DistillationModel Compression	—Unverified	0
Extreme Model Compression for On-device Natural Language Understanding	Nov 30, 2020	Model CompressionNatural Language Understanding	—Unverified	0
KD-Lib: A PyTorch library for Knowledge Distillation, Pruning and Quantization	Nov 30, 2020	Knowledge DistillationModel Compression	CodeCode Available	1
Context-aware deep model compression for edge cloud computing	Nov 29, 2020	Cloud ComputingImage Classification	—Unverified	0
Bringing AI To Edge: From Deep Learning's Perspective	Nov 25, 2020	Deep LearningEdge-computing	—Unverified	0
Auto Graph Encoder-Decoder for Neural Network Pruning	Nov 25, 2020	DecoderModel Compression	—Unverified	0
torchdistill: A Modular, Configuration-Driven Framework for Knowledge Distillation	Nov 25, 2020	Image ClassificationInstance Segmentation	—Unverified	0
Head Network Distillation: Splitting Distilled Deep Neural Networks for Resource-Constrained Edge Computing Systems	Nov 20, 2020	Edge-computingimage-classification	CodeCode Available	1
HAWQV3: Dyadic Neural Network Quantization	Nov 20, 2020	Model CompressionQuantization	CodeCode Available	1
Empirical Evaluation of Deep Learning Model Compression Techniques on the WaveNet Vocoder	Nov 20, 2020	Model CompressionQuantization	CodeCode Available	0
MixMix: All You Need for Data-Free Compression Are Feature and Data Mixing	Nov 19, 2020	AllKnowledge Distillation	—Unverified	0
Online Ensemble Model Compression using Knowledge Distillation	Nov 15, 2020	Knowledge Distillationmodel	CodeCode Available	0
Gaussian RAM: Lightweight Image Classification via Stochastic Retina-Inspired Glimpse and Reinforcement Learning	Nov 12, 2020	ClassificationGeneral Classification	CodeCode Available	1
Automated Model Compression by Jointly Applied Pruning and Quantization	Nov 12, 2020	AutoMLModel Compression	—Unverified	0
Effective Model Compression via Stage-wise Pruning	Nov 10, 2020	modelModel Compression	—Unverified	0
Neural Network Compression Via Sparse Optimization	Nov 10, 2020	Model CompressionNeural Network Compression	—Unverified	0
Knowledge Distillation for Singing Voice Detection	Nov 9, 2020	Information RetrievalKnowledge Distillation	CodeCode Available	0
Robustness and Diversity Seeking Data-Free Knowledge Distillation	Nov 7, 2020	Data-free Knowledge DistillationDiversity	CodeCode Available	0
Know What You Don't Need: Single-Shot Meta-Pruning for Attention Heads	Nov 7, 2020	InformativenessMeta-Learning	—Unverified	0
Self-Supervised Learning from Contrastive Mixtures for Personalized Speech Enhancement	Nov 6, 2020	Contrastive LearningFew-Shot Learning	CodeCode Available	0
A Tunable Robust Pruning Framework Through Dynamic Network Rewiring of DNNs	Nov 3, 2020	image-classificationImage Classification	CodeCode Available	0
VEGA: Towards an End-to-End Configurable AutoML Pipeline	Nov 3, 2020	AutoMLBIG-bench Machine Learning	CodeCode Available	1
Exploring the Boundaries of Low-Resource BERT Distillation	Nov 1, 2020	Model Compression	—Unverified	0
Watermarking Graph Neural Networks by Random Graphs	Nov 1, 2020	Graph Neural NetworkModel Compression	—Unverified	0
Passport-aware Normalization for Deep Model Protection	Oct 29, 2020	modelModel Compression	CodeCode Available	1
CompRess: Self-Supervised Learning by Compressing Representations	Oct 28, 2020	Linear evaluationModel Compression	CodeCode Available	1
Activation Map Adaptation for Effective Knowledge Distillation	Oct 26, 2020	Knowledge DistillationModel Compression	—Unverified	0
MARS: Multi-macro Architecture SRAM CIM-Based Accelerator with Co-designed Compressed Neural Networks	Oct 24, 2020	Model CompressionNetwork Pruning	—Unverified	0

Show:10 25 50

← PrevPage 20 of 28Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified