Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 576–600 of 1356 papers

Title	Date	Tasks	Status
FedCode: Communication-Efficient Federated Learning via Transferring Codebooks	Nov 15, 2023	Federated LearningModel Compression	—Unverified
EPIM: Efficient Processing-In-Memory Accelerators based on Epitome	Nov 12, 2023	Model CompressionNeural Architecture Search	—Unverified
What is Lost in Knowledge Distillation?	Nov 7, 2023	Knowledge DistillationModel Compression	—Unverified
Supervised domain adaptation for building extraction from off-nadir aerial images	Nov 7, 2023	Domain AdaptationEarth Observation	—Unverified
Asymmetric Masked Distillation for Pre-Training Small Foundation Models	Nov 6, 2023	Action ClassificationAction Recognition	CodeCode Available
Data-Free Distillation of Language Model by Text-to-Text Transfer	Nov 3, 2023	Data-free Knowledge DistillationDiversity	—Unverified
Divergent Token Metrics: Measuring degradation to prune away LLM components -- and optimize quantization	Nov 2, 2023	ManagementModel Compression	—Unverified
Retrieval-based Knowledge Transfer: An Effective Approach for Extreme Large Language Model Compression	Oct 24, 2023	Language ModelingLanguage Modelling	—Unverified
LXMERT Model Compression for Visual Question Answering	Oct 23, 2023	modelModel Compression	CodeCode Available
Data-Free Knowledge Distillation Using Adversarially Perturbed OpenGL Shader Images	Oct 20, 2023	Data AugmentationData-free Knowledge Distillation	—Unverified
In defense of parameter sharing for model-compression	Oct 17, 2023	Model Compression	—Unverified
USDC: Unified Static and Dynamic Compression for Visual Transformer	Oct 17, 2023	Model Compression	—Unverified
Efficient Apple Maturity and Damage Assessment: A Lightweight Detection Model with GAN and Attention Mechanism	Oct 13, 2023	Decision MakingModel Compression	—Unverified
What do larger image classifiers memorise?	Oct 9, 2023	image-classificationImage Classification	—Unverified
Accelerating Machine Learning Primitives on Commodity Hardware	Oct 8, 2023	CPUModel Compression	—Unverified
A Corrected Expected Improvement Acquisition Function Under Noisy Observations	Oct 8, 2023	Bayesian OptimizationModel Compression	CodeCode Available
Model Compression in Practice: Lessons Learned from Practitioners Creating On-device Machine Learning Experiences	Oct 6, 2023	Model Compression	—Unverified
Robustness-Guided Image Synthesis for Data-Free Quantization	Oct 5, 2023	Data Free QuantizationDiversity	—Unverified
Sparse Deep Learning for Time Series Data: Theory and Applications	Oct 5, 2023	Deep LearningModel Compression	—Unverified
ECoFLaP: Efficient Coarse-to-Fine Layer-Wise Pruning for Vision-Language Models	Oct 4, 2023	Model Compression	—Unverified
Sweeping Heterogeneity with Smart MoPs: Mixture of Prompts for LLM Task Adaptation	Oct 4, 2023	Model CompressionText Summarization	—Unverified
Artemis: HE-Aware Training for Efficient Privacy-Preserving Machine Learning	Oct 2, 2023	Model CompressionPrivacy Preserving	—Unverified
Bridging the Gap Between Foundation Models and Heterogeneous Federated Learning	Sep 30, 2023	Federated LearningModel Compression	—Unverified
Distilling Inductive Bias: Knowledge Distillation Beyond Model Compression	Sep 30, 2023	Inductive BiasKnowledge Distillation	—Unverified
CAIT: Triple-Win Compression towards High Accuracy, Fast Inference, and Favorable Transferability For ViTs	Sep 27, 2023	Model CompressionSemantic Segmentation	—Unverified

Show:10 25 50

← PrevPage 24 of 55Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified