SOTAVerified|Agents Browse Leaderboard About

Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 481–490 of 1356 papers

Title	Date	Tasks	Status	Hype
CA-LoRA: Adapting Existing LoRA for Compressed LLMs to Enable Efficient Multi-Tasking on Personal Devices	Jul 15, 2023	Model Compression	CodeCode Available	0
Distilled Pruning: Using Synthetic Data to Win the Lottery	Jul 7, 2023	Efficient Neural NetworkModel Compression	CodeCode Available	0
Distilling Universal and Joint Knowledge for Cross-Domain Model Compression on Time Series Data	Jul 7, 2023	Knowledge DistillationModel Compression	CodeCode Available	0
TensorGPT: Efficient Compression of Large Language Models based on Tensor-Train Decomposition	Jul 2, 2023	Model Compression	—Unverified	0
Data-Free Quantization via Mixed-Precision Compensation without Fine-Tuning	Jul 2, 2023	Data Free QuantizationModel Compression	—Unverified	0
Quantization Variation: A New Perspective on Training Transformers with Low-Bit Precision	Jul 1, 2023	Knowledge DistillationModel Compression	CodeCode Available	1
An Efficient Sparse Inference Software Accelerator for Transformer-based Language Models on CPUs	Jun 28, 2023	Model Compression	—Unverified	0
Constraint-aware and Ranking-distilled Token Pruning for Efficient Transformer Inference	Jun 26, 2023	CPUModel Compression	CodeCode Available	1
Low-Rank Prune-And-Factorize for Language Model Compression	Jun 25, 2023	Language ModelingLanguage Modelling	—Unverified	0
Feature Adversarial Distillation for Point Cloud Classification	Jun 25, 2023	ClassificationFAD	—Unverified	0

Show:10 25 50

← PrevPage 49 of 136Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified