Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 551–600 of 1356 papers

Title	Date	Tasks	Status	Hype
Structured Bayesian Compression for Deep Neural Networks Based on The Turbo-VBI Approach	Feb 21, 2023	Model Compression	—Unverified	0
HomoDistil: Homotopic Task-Agnostic Distillation of Pre-trained Transformers	Feb 19, 2023	Knowledge DistillationModel Compression	—Unverified	0
A Comprehensive Review and a Taxonomy of Edge Machine Learning: Requirements, Paradigms, and Techniques	Feb 16, 2023	Edge-computingModel Compression	—Unverified	0
Towards Optimal Compression: Joint Pruning and Quantization	Feb 15, 2023	Model CompressionNeural Architecture Search	—Unverified	0
Dual Relation Knowledge Distillation for Object Detection	Feb 11, 2023	Knowledge DistillationModel Compression	CodeCode Available	1
On Achieving Privacy-Preserving State-of-the-Art Edge Intelligence	Feb 10, 2023	Edge-computingModel Compression	—Unverified	0
Knowledge Distillation in Vision Transformers: A Critical Review	Feb 4, 2023	Decoderimage-classification	—Unverified	0
Generalized Uncertainty of Deep Neural Networks: Taxonomy and Applications	Feb 2, 2023	Knowledge DistillationModel Compression	—Unverified	0
Knowledge Distillation on Graphs: A Survey	Feb 1, 2023	Knowledge DistillationModel Compression	—Unverified	0
UPop: Unified and Progressive Pruning for Compressing Vision-Language Transformers	Jan 31, 2023	Image CaptioningImage Classification	CodeCode Available	1
AMD: Adaptive Masked Distillation for Object Detection	Jan 31, 2023	Knowledge DistillationModel Compression	—Unverified	0
Improved knowledge distillation by utilizing backward pass knowledge in neural networks	Jan 27, 2023	Knowledge DistillationModel Compression	—Unverified	0
Accelerating and Compressing Deep Neural Networks for Massive MIMO CSI Feedback	Jan 20, 2023	Model CompressionNetwork Pruning	CodeCode Available	0
HALOC: Hardware-Aware Automatic Low-Rank Compression for Compact Neural Networks	Jan 20, 2023	GPULow-rank compression	—Unverified	0
HCE: Improving Performance and Efficiency with Heterogeneously Compressed Neural Network Ensemble	Jan 18, 2023	DiversityEnsemble Learning	—Unverified	0
SSDA: Secure Source-Free Domain Adaptation	Jan 1, 2023	Backdoor AttackDomain Adaptation	CodeCode Available	0
Tiny Updater: Towards Efficient Neural Network-Driven Software Updating	Jan 1, 2023	Efficient Neural Networkimage-classification	CodeCode Available	0
ICD-Face: Intra-class Compactness Distillation for Face Recognition	Jan 1, 2023	Face RecognitionKnowledge Distillation	—Unverified	0
Memory-Friendly Scalable Super-Resolution via Rewinding Lottery Ticket Hypothesis	Jan 1, 2023	image-classificationImage Classification	—Unverified	0
One-Shot Model for Mixed-Precision Quantization	Jan 1, 2023	modelModel Compression	—Unverified	0
Distilling Focal Knowledge From Imperfect Expert for 3D Object Detection	Jan 1, 2023	3D geometry3D Object Detection	CodeCode Available	0
Compression-Aware Video Super-Resolution	Jan 1, 2023	Model CompressionSuper-Resolution	CodeCode Available	1
FlatENN: Train Flat for Enhanced Fault Tolerance of Quantized Deep Neural Networks	Dec 29, 2022	Model CompressionQuantization	—Unverified	0
BD-KD: Balancing the Divergences for Online Knowledge Distillation	Dec 25, 2022	Knowledge DistillationModel Compression	—Unverified	0
FFNeRV: Flow-Guided Frame-Wise Neural Representations for Videos	Dec 23, 2022	Model CompressionQuantization	CodeCode Available	1
Spike encoding techniques for IoT time-varying signals benchmarked on a neuromorphic classification task	Dec 21, 2022	Model CompressionTransfer Learning	CodeCode Available	0
FSCNN: A Fast Sparse Convolution Neural Network Inference System	Dec 17, 2022	Model Compression	—Unverified	0
Can We Find Strong Lottery Tickets in Generative Models?	Dec 16, 2022	Model CompressionNetwork Pruning	—Unverified	0
Swing Distillation: A Privacy-Preserving Knowledge Distillation Framework	Dec 16, 2022	Knowledge DistillationModel Compression	—Unverified	0
RepQ-ViT: Scale Reparameterization for Post-Training Quantization of Vision Transformers	Dec 16, 2022	Model CompressionQuantization	CodeCode Available	1
Efficient Speech Representation Learning with Low-Bit Quantization	Dec 14, 2022	Model CompressionQuantization	—Unverified	0
Error-aware Quantization through Noise Tempering	Dec 11, 2022	Model CompressionQuantization	—Unverified	0
Leveraging Different Learning Styles for Improved Knowledge Distillation in Biomedical Imaging	Dec 6, 2022	Knowledge DistillationModel Compression	—Unverified	0
FedUKD: Federated UNet Model with Knowledge Distillation for Land Use Classification from Satellite and Street Views	Dec 5, 2022	Knowledge DistillationModel Compression	CodeCode Available	1
CSTAR: Towards Compact and STructured Deep Neural Networks with Adversarial Robustness	Dec 4, 2022	Adversarial RobustnessModel Compression	—Unverified	0
GlueFL: Reconciling Client Sampling and Model Masking for Bandwidth Efficient Federated Learning	Dec 3, 2022	Federated LearningModel Compression	—Unverified	0
Compressing Cross-Lingual Multi-Task Models at Qualtrics	Nov 29, 2022	ManagementModel Compression	—Unverified	0
Compressing Volumetric Radiance Fields to 1 MB	Nov 29, 2022	Model CompressionNeRF	CodeCode Available	2
Discovering Dynamic Patterns from Spatiotemporal Data with Time-Varying Low-Rank Autoregression	Nov 28, 2022	Model Compression	CodeCode Available	1
Unbiased Knowledge Distillation for Recommendation	Nov 27, 2022	Knowledge DistillationModel Compression	CodeCode Available	1
Design and Prototyping Distributed CNN Inference Acceleration in Edge Computing	Nov 24, 2022	Distributed ComputingEdge-computing	—Unverified	0
Sparse Probabilistic Circuits via Pruning and Growing	Nov 22, 2022	Model Compression	CodeCode Available	1
Learning Low-Rank Representations for Model Compression	Nov 21, 2022	Clusteringmodel	—Unverified	0
Understanding and Improving Knowledge Distillation for Quantization-Aware Training of Large Transformer Encoders	Nov 20, 2022	Knowledge DistillationModel Compression	CodeCode Available	0
Is Smaller Always Faster? Tradeoffs in Compressing Self-Supervised Speech Transformers	Nov 17, 2022	Knowledge DistillationModel Compression	CodeCode Available	0
Edge-MultiAI: Multi-Tenancy of Latency-Sensitive Deep Learning Applications on Edge	Nov 14, 2022	ManagementModel Compression	—Unverified	0
Understanding the Role of Mixup in Knowledge Distillation: An Empirical Study	Nov 8, 2022	AttributeData Augmentation	CodeCode Available	0
XAI-BayesHAR: A novel Framework for Human Activity Recognition with Integrated Uncertainty and Shapely Values	Nov 7, 2022	Activity RecognitionExplainable Artificial Intelligence (XAI)	—Unverified	0
Model Compression for DNN-based Speaker Verification Using Weight Quantization	Oct 31, 2022	Model CompressionQuantization	—Unverified	0
GPTQ: Accurate Post-Training Quantization for Generative Pre-trained Transformers	Oct 31, 2022	GPULanguage Modelling	CodeCode Available	7

Show:10 25 50

← PrevPage 12 of 28Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified