SOTAVerified|Agents Browse Leaderboard About

Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 101–110 of 1356 papers

Title	Date	Tasks	Status	Hype
Synergistic Effects of Knowledge Distillation and Structured Pruning for Self-Supervised Speech Models	Feb 9, 2025	Knowledge DistillationModel Compression	—Unverified	0
Theoretical Guarantees for Low-Rank Compression of Deep Neural Networks	Feb 4, 2025	Low-rank compressionModel Compression	—Unverified	0
Activation-Informed Merging of Large Language Models	Feb 4, 2025	Computational EfficiencyContinual Learning	CodeCode Available	1
Accelerating Linear Recurrent Neural Networks for the Edge with Unstructured Sparsity	Feb 3, 2025	Audio DenoisingDenoising	—Unverified	0
MIND: Modality-Informed Knowledge Distillation Framework for Multimodal Clinical Prediction Tasks	Feb 3, 2025	ImputationKnowledge Distillation	—Unverified	0
Attention Sinks and Outlier Features: A 'Catch, Tag, and Release' Mechanism for Embeddings	Feb 2, 2025	Model CompressionTAG	—Unverified	0
Role of Mixup in Topological Persistence Based Knowledge Distillation for Wearable Sensor Data	Feb 2, 2025	Data AugmentationKnowledge Distillation	—Unverified	0
Huff-LLM: End-to-End Lossless Compression for Efficient LLM Inference	Feb 2, 2025	Model CompressionQuantization	—Unverified	0
Efficient Supernet Training with Orthogonal Softmax for Scalable ASR Model Compression	Jan 31, 2025	Model Compression	—Unverified	0
Pivoting Factorization: A Compact Meta Low-Rank Representation of Sparsity for Efficient Inference in Large Language Models	Jan 31, 2025	GPUModel Compression	—Unverified	0

Show:10 25 50

← PrevPage 11 of 136Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified