Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 751–800 of 1356 papers

Title	Date	Tasks	Status	Hype
Comprehensive Knowledge Distillation with Causal Intervention	Dec 1, 2021	Causal InferenceKnowledge Distillation	CodeCode Available	1
Formalizing Generalization and Adversarial Robustness of Neural Networks to Weight Perturbations	Dec 1, 2021	Adversarial RobustnessModel Compression	—Unverified	0
Aligned Structured Sparsity Learning for Efficient Image Super-Resolution	Dec 1, 2021	Image Super-ResolutionKnowledge Distillation	CodeCode Available	1
A Unified Pruning Framework for Vision Transformers	Nov 30, 2021	Model Compressionobject-detection	CodeCode Available	1
FedHM: Efficient Federated Learning for Heterogeneous Models via Low-rank Factorization	Nov 29, 2021	Distributed ComputingFederated Learning	—Unverified	0
Exploring Low-Cost Transformer Model Compression for Large-Scale Commercial Reply Suggestions	Nov 27, 2021	Model Compression	—Unverified	0
Accelerating Deep Learning with Dynamic Data Pruning	Nov 24, 2021	AttributeDeep Learning	—Unverified	0
NAM: Normalization-based Attention Module	Nov 24, 2021	Model Compression	CodeCode Available	1
Sharpness-aware Quantization for Deep Neural Networks	Nov 24, 2021	Image ClassificationModel Compression	CodeCode Available	1
Semi-Online Knowledge Distillation	Nov 23, 2021	Knowledge DistillationModel Compression	CodeCode Available	0
Automatic Mapping of the Best-Suited DNN Pruning Schemes for Real-Time Mobile Acceleration	Nov 22, 2021	Model Compression	—Unverified	0
Local-Selective Feature Distillation for Single Image Super-Resolution	Nov 22, 2021	Image Super-ResolutionKnowledge Distillation	—Unverified	0
Structured Pruning Learns Compact and Accurate Models	Nov 16, 2021	Model Compression	—Unverified	0
Weight Squeezing: Reparameterization for Knowledge Transfer and Model Compression	Nov 16, 2021	Model Compressiontext-classification	—Unverified	0
Learning-Based Symbol Level Precoding: A Memory-Efficient Unsupervised Learning Approach	Nov 15, 2021	Model Compression	—Unverified	0
Learning Interpretation with Explainable Knowledge Distillation	Nov 12, 2021	Knowledge DistillationModel Compression	—Unverified	0
Domain Generalization on Efficient Acoustic Scene Classification using Residual Normalization	Nov 12, 2021	Acoustic Scene ClassificationClassification	—Unverified	0
A Survey on Green Deep Learning	Nov 8, 2021	Deep LearningKnowledge Distillation	—Unverified	0
SEOFP-NET: Compression and Acceleration of Deep Neural Networks for Speech Enhancement Using Sign-Exponent-Only Floating-Points	Nov 8, 2021	Model Compressionregression	—Unverified	0
LiMuSE: Lightweight Multi-modal Speaker Extraction	Nov 7, 2021	Model CompressionQuantization	CodeCode Available	1
Oracle Teacher: Leveraging Target Information for Better Knowledge Distillation of CTC Models	Nov 5, 2021	Knowledge DistillationMachine Translation	—Unverified	0
Weight, Block or Unit? Exploring Sparsity Tradeoffs for Speech Enhancement on Tiny Neural Accelerators	Nov 3, 2021	Model CompressionSpeech Enhancement	—Unverified	0
How to Select One Among All ? An Empirical Study Towards the Robustness of Knowledge Distillation in Natural Language Understanding	Nov 1, 2021	Adversarial RobustnessAll	—Unverified	0
Distilling Object Detectors with Feature Richness	Nov 1, 2021	Knowledge DistillationModel Compression	CodeCode Available	1
ILMPQ : An Intra-Layer Multi-Precision Deep Neural Network Quantization framework for FPGA	Oct 30, 2021	Edge-computingModel Compression	—Unverified	0
On Cross-Layer Alignment for Model Fusion of Heterogeneous Neural Networks	Oct 29, 2021	Knowledge DistillationModel Compression	—Unverified	0
Generalized Depthwise-Separable Convolutions for Adversarially Robust and Efficient Neural Networks	Oct 28, 2021	Model Compression	CodeCode Available	1
Reconstructing Pruned Filters using Cheap Spatial Transformations	Oct 25, 2021	Feature CompressionKnowledge Distillation	—Unverified	0
Exploring Gradient Flow Based Saliency for DNN Model Compression	Oct 24, 2021	Denoisingimage-classification	CodeCode Available	0
How and When Adversarial Robustness Transfers in Knowledge Distillation?	Oct 22, 2021	Adversarial RobustnessKnowledge Distillation	—Unverified	0
Analysis of memory consumption by neural networks based on hyperparameters	Oct 21, 2021	Deep LearningModel Compression	—Unverified	0
Augmenting Knowledge Distillation With Peer-To-Peer Mutual Learning For Model Compression	Oct 21, 2021	Knowledge DistillationModel Compression	—Unverified	0
Accelerating Framework of Transformer by Hardware Design and Model Compression Co-Optimization	Oct 19, 2021	CPUGPU	—Unverified	0
Pro-KD: Progressive Distillation by Following the Footsteps of the Teacher	Oct 16, 2021	image-classificationImage Classification	—Unverified	0
A Short Study on Compressing Decoder-Based Language Models	Oct 16, 2021	DecoderKnowledge Distillation	—Unverified	0
HRKD: Hierarchical Relational Knowledge Distillation for Cross-domain Language Model Compression	Oct 16, 2021	Few-Shot LearningKnowledge Distillation	CodeCode Available	0
Robustness Challenges in Model Distillation and Pruning for Natural Language Understanding	Oct 16, 2021	Knowledge DistillationModel Compression	—Unverified	0
Differentiable Network Pruning for Microcontrollers	Oct 15, 2021	Model CompressionNetwork Pruning	—Unverified	0
Joint Channel and Weight Pruning for Model Acceleration on Moblie Devices	Oct 15, 2021	Model Compression	CodeCode Available	1
Kronecker Decomposition for GPT Compression	Oct 15, 2021	Knowledge DistillationLanguage Modeling	—Unverified	0
A Memory-Efficient Learning Framework for SymbolLevel Precoding with Quantized NN Weights	Oct 13, 2021	Model CompressionQuantization	—Unverified	0
Rectifying the Data Bias in Knowledge Distillation	Oct 11, 2021	Face RecognitionFace Verification	—Unverified	0
FedDQ: Communication-Efficient Federated Learning with Descending Quantization	Oct 5, 2021	Federated LearningModel Compression	—Unverified	0
Robot Intent Recognition Method Based on State Grid Business Office	Sep 29, 2021	Intent DetectionIntent Recognition	—Unverified	0
A Unified Knowledge Distillation Framework for Deep Directed Graphical Models	Sep 29, 2021	Continual LearningFederated Learning	—Unverified	0
KIMERA: Injecting Domain Knowledge into Vacant Transformer Heads	Sep 29, 2021	Information RetrievalModel Compression	—Unverified	0
Sparse Unbalanced GAN Training with In-Time Over-Parameterization	Sep 29, 2021	Model Compression	—Unverified	0
Prototypical Contrastive Predictive Coding	Sep 29, 2021	Contrastive LearningKnowledge Distillation	—Unverified	0
Model Compression via Symmetries of the Parameter Space	Sep 29, 2021	modelModel Compression	—Unverified	0
Learning Efficient Image Super-Resolution Networks via Structure-Regularized Pruning	Sep 29, 2021	Image Super-ResolutionKnowledge Distillation	—Unverified	0

Show:10 25 50

← PrevPage 16 of 28Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified