Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 451–500 of 1356 papers

Title	Date	Tasks	Status	Score
Compressing Convolutional Neural Networks via Factorized Convolutional Filters	Jun 1, 2019	Model Compression	CodeCode Available	5
Exploiting Kernel Sparsity and Entropy for Interpretable CNN Compression	Dec 11, 2018	ClusteringModel Compression	CodeCode Available	5
FedSynth: Gradient Compression via Synthetic Data in Federated Learning	Apr 4, 2022	Federated LearningModel Compression	CodeCode Available	5
Trio-ViT: Post-Training Quantization and Acceleration for Softmax-Free Efficient Vision Transformer	May 6, 2024	Efficient ViTsModel Compression	CodeCode Available	5
From Dense to Sparse: Contrastive Pruning for Better Pre-trained Language Model Compression	Dec 14, 2021	Contrastive LearningLanguage Modeling	CodeCode Available	5
Compressed models are NOT miniature versions of large models	Jul 18, 2024	Adversarial AttackModel Compression	—Unverified	0
Artemis: HE-Aware Training for Efficient Privacy-Preserving Machine Learning	Oct 2, 2023	Model CompressionPrivacy Preserving	—Unverified	0
Comprehensive Survey of Model Compression and Speed up for Vision Transformers	Apr 16, 2024	Computational EfficiencyEdge-computing	—Unverified	0
Are We There Yet? A Measurement Study of Efficiency for LLM Applications on Mobile Devices	Mar 10, 2025	CPUGPU	—Unverified	0
Comprehensive Study on Performance Evaluation and Optimization of Model Compression: Bridging Traditional Deep Learning and Large Language Models	Jul 22, 2024	Deep Learningimage-classification	—Unverified	0
ESPACE: Dimensionality Reduction of Activations for Model Compression	Oct 7, 2024	Dimensionality Reductionmodel	—Unverified	0
Compositionality Unlocks Deep Interpretable Models	Apr 3, 2025	Model CompressionTensor Networks	—Unverified	0
A Comprehensive Review and a Taxonomy of Edge Machine Learning: Requirements, Paradigms, and Techniques	Feb 16, 2023	Edge-computingModel Compression	—Unverified	0
Accelerating Very Deep Convolutional Networks for Classification and Detection	May 26, 2015	ClassificationGeneral Classification	—Unverified	0
EPSD: Early Pruning with Self-Distillation for Efficient Model Compression	Jan 31, 2024	Knowledge DistillationModel Compression	—Unverified	0
EoRA: Training-free Compensation for Compressed LLM with Eigenspace Low-Rank Approximation	Oct 28, 2024	ARCMath	—Unverified	0
CompMarkGS: Robust Watermarking for Compressed 3D Gaussian Splatting	Mar 17, 2025	3DGS3D Reconstruction	—Unverified	0
Ensemble-Compression: A New Method for Parallel Training of Deep Neural Networks	Jun 2, 2016	Model Compression	—Unverified	0
Enhancing Targeted Attack Transferability via Diversified Weight Pruning	Aug 18, 2022	DiversityModel Compression	—Unverified	0
Complexity-Driven CNN Compression for Resource-constrained Edge AI	Aug 26, 2022	Computational EfficiencyModel Compression	—Unverified	0
Architecture Compression	Feb 8, 2019	DecoderModel Compression	—Unverified	0
Compacting Deep Neural Networks for Internet of Things: Methods and Applications	Mar 20, 2021	DiversityKnowledge Distillation	—Unverified	0
Enhanced Sparsification via Stimulative Training	Mar 11, 2024	Knowledge DistillationModel Compression	—Unverified	0
CompactifAI: Extreme Compression of Large Language Models using Quantum-Inspired Tensor Networks	Jan 25, 2024	Model CompressionQuantization	—Unverified	0
Energy-efficient Knowledge Distillation for Spiking Neural Networks	Jun 14, 2021	Knowledge DistillationModel Compression	—Unverified	0
EncCluster: Scalable Functional Encryption in Federated Learning through Weight Clustering and Probabilistic Filters	Jun 13, 2024	Federated LearningModel Compression	—Unverified	0
Compact CNN Structure Learning by Knowledge Distillation	Apr 19, 2021	Knowledge DistillationModel Compression	—Unverified	0
A Progressive Sub-Network Searching Framework for Dynamic Inference	Sep 11, 2020	Model Compression	—Unverified	0
A Deep Cascade Network for Unaligned Face Attribute Classification	Sep 12, 2017	AttributeClassification	—Unverified	0
Accelerating Machine Learning Primitives on Commodity Hardware	Oct 8, 2023	CPUModel Compression	—Unverified	0
Enabling Deep Learning on Edge Devices through Filter Pruning and Knowledge Transfer	Jan 22, 2022	image-classificationImage Classification	—Unverified	0
Energy-Efficient Model Compression and Splitting for Collaborative Inference Over Time-Varying Channels	Jun 2, 2021	Collaborative Inferenceimage-classification	—Unverified	0
Enabling All In-Edge Deep Learning: A Literature Review	Apr 7, 2022	AllDeep Learning	—Unverified	0
Enable Deep Learning on Mobile Devices: Methods, Systems, and Applications	Apr 25, 2022	AutoMLDeep Learning	—Unverified	0
Communication-Efficient Federated Learning with Adaptive Compression under Dynamic Bandwidth	May 6, 2024	Federated LearningModel Compression	—Unverified	0
Enhancing Inference Efficiency of Large Language Models: Investigating Optimization Strategies and Architectural Innovations	Apr 2, 2024	Model Compression	—Unverified	0
Empowering Edge Intelligence: A Comprehensive Survey on On-Device AI Models	Mar 8, 2025	Edge-computingModel Compression	—Unverified	0
ELRT: Efficient Low-Rank Training for Compact Convolutional Neural Networks	Jan 18, 2024	Low-rank compressionModel Compression	—Unverified	0
Communication-Efficient Distributed Online Learning with Kernels	Nov 28, 2019	Model Compression	—Unverified	0
A Privacy-Preserving-Oriented DNN Pruning and Mobile Acceleration Framework	Mar 13, 2020	Model CompressionPrivacy Preserving	—Unverified	0
E-LANG: Energy-Based Joint Inferencing of Super and Swift Language Models	Mar 1, 2022	Decision MakingModel Compression	—Unverified	0
EPIM: Efficient Processing-In-Memory Accelerators based on Epitome	Nov 12, 2023	Model CompressionNeural Architecture Search	—Unverified	0
Efficient Transformer Knowledge Distillation: A Performance Review	Nov 22, 2023	Knowledge DistillationModel Compression	—Unverified	0
Error-aware Quantization through Noise Tempering	Dec 11, 2022	Model CompressionQuantization	—Unverified	0
Approximability and Generalisation	Mar 15, 2022	Learning TheoryModel Compression	—Unverified	0
Every Expert Matters: Towards Effective Knowledge Distillation for Mixture-of-Experts Language Models	Feb 18, 2025	Knowledge DistillationMixture-of-Experts	—Unverified	0
Efficient Supernet Training with Orthogonal Softmax for Scalable ASR Model Compression	Jan 31, 2025	Model Compression	—Unverified	0
Efficient Speech Representation Learning with Low-Bit Quantization	Dec 14, 2022	Model CompressionQuantization	—Unverified	0
Efficient Recurrent Neural Networks using Structured Matrices in FPGAs	Mar 20, 2018	Model CompressionTime Series	—Unverified	0
CoLLD: Contrastive Layer-to-layer Distillation for Compressing Multilingual Pre-trained Speech Encoders	Sep 14, 2023	Contrastive LearningKnowledge Distillation	—Unverified	0

Show:10 25 50

← PrevPage 10 of 28Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified