Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 876–900 of 1356 papers

Title	Date	Tasks	Status
Kronecker Decomposition for GPT Compression	Oct 15, 2021	Knowledge DistillationLanguage Modeling	—Unverified
Differentiable Network Pruning for Microcontrollers	Oct 15, 2021	Model CompressionNetwork Pruning	—Unverified
A Memory-Efficient Learning Framework for SymbolLevel Precoding with Quantized NN Weights	Oct 13, 2021	Model CompressionQuantization	—Unverified
Rectifying the Data Bias in Knowledge Distillation	Oct 11, 2021	Face RecognitionFace Verification	—Unverified
FedDQ: Communication-Efficient Federated Learning with Descending Quantization	Oct 5, 2021	Federated LearningModel Compression	—Unverified
KIMERA: Injecting Domain Knowledge into Vacant Transformer Heads	Sep 29, 2021	Information RetrievalModel Compression	—Unverified
A Unified Knowledge Distillation Framework for Deep Directed Graphical Models	Sep 29, 2021	Continual LearningFederated Learning	—Unverified
Sparse Unbalanced GAN Training with In-Time Over-Parameterization	Sep 29, 2021	Model Compression	—Unverified
HFSP: A Hardware-friendly Soft Pruning Framework for Vision Transformers	Sep 29, 2021	image-classificationImage Classification	—Unverified
Model Compression via Symmetries of the Parameter Space	Sep 29, 2021	modelModel Compression	—Unverified
Learning Efficient Image Super-Resolution Networks via Structure-Regularized Pruning	Sep 29, 2021	Image Super-ResolutionKnowledge Distillation	—Unverified
Robot Intent Recognition Method Based on State Grid Business Office	Sep 29, 2021	Intent DetectionIntent Recognition	—Unverified
Prototypical Contrastive Predictive Coding	Sep 29, 2021	Contrastive LearningKnowledge Distillation	—Unverified
Bayesian Optimization with Clustering and Rollback for CNN Auto Pruning	Sep 22, 2021	Bayesian OptimizationClustering	CodeCode Available
Classification-based Quality Estimation: Small and Efficient Models for Real-world Applications	Sep 17, 2021	Machine TranslationModel Compression	—Unverified
Experimental implementation of a neural network optical channel equalizer in restricted hardware using pruning and quantization	Sep 15, 2021	CPUEdge-computing	—Unverified
A Note on Knowledge Distillation Loss Function for Object Classification	Sep 14, 2021	Knowledge DistillationModel Compression	—Unverified
Multihop: Leveraging Complex Models to Learn Accurate Simple Models	Sep 14, 2021	Explainable artificial intelligenceKnowledge Distillation	—Unverified
KroneckerBERT: Learning Kronecker Decomposition for Pre-trained Language Models via Knowledge Distillation	Sep 13, 2021	Knowledge DistillationLanguage Modeling	—Unverified
Causal Explanation of Convolutional Neural Networks	Sep 13, 2021	counterfactualCounterfactual Explanation	CodeCode Available
BioNetExplorer: Architecture-Space Exploration of Bio-Signal Processing Deep Neural Networks for Wearables	Sep 7, 2021	Model Compression	—Unverified
GDP: Stabilized Neural Network Pruning via Gates with Differentiable Polarization	Sep 6, 2021	channel selectionModel Compression	—Unverified
Full-Cycle Energy Consumption Benchmark for Low-Carbon Computer Vision	Aug 30, 2021	Deep LearningModel Compression	—Unverified
Lipschitz Continuity Guided Knowledge Distillation	Aug 29, 2021	Knowledge DistillationModel Compression	—Unverified
DKM: Differentiable K-Means Clustering Layer for Neural Network Compression	Aug 28, 2021	ClusteringModel Compression	—Unverified

Show:10 25 50

← PrevPage 36 of 55Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified