Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–650 of 1356 papers

Title	Date	Tasks	Status	Hype
Fast DistilBERT on CPUs	Oct 27, 2022	Knowledge DistillationModel Compression	—Unverified	0
COST-EFF: Collaborative Optimization of Spatial and Temporal Efficiency with Slenderized Multi-exit Language Models	Oct 27, 2022	Model Compression	CodeCode Available	0
Online Cross-Layer Knowledge Distillation on Graph Neural Networks with Deep Supervision	Oct 25, 2022	Knowledge DistillationModel Compression	—Unverified	0
Legal-Tech Open Diaries: Lesson learned on how to develop and deploy light-weight models in the era of humongous Language Models	Oct 24, 2022	Knowledge DistillationModel Compression	—Unverified	0
Outsourcing Training without Uploading Data via Efficient Collaborative Open-Source Sampling	Oct 23, 2022	Model Compression	—Unverified	0
Sub-network Multi-objective Evolutionary Algorithm for Filter Pruning	Oct 22, 2022	Combinatorial OptimizationEvolutionary Algorithms	—Unverified	0
Data-Model-Circuit Tri-Design for Ultra-Light Video Intelligence on Edge Devices	Oct 16, 2022	Model CompressionMulti-Object Tracking	—Unverified	0
FIT: A Metric for Model Sensitivity	Oct 16, 2022	modelModel Compression	—Unverified	0
Parameter-Efficient Masking Networks	Oct 13, 2022	Model Compression	CodeCode Available	1
Boosting Graph Neural Networks via Adaptive Knowledge Distillation	Oct 12, 2022	Graph ClassificationGraph Mining	—Unverified	0
SeKron: A Decomposition Method Supporting Many Factorization Structures	Oct 12, 2022	Model CompressionTensor Decomposition	—Unverified	0
Deep learning model compression using network sensitivity and gradients	Oct 11, 2022	Deep LearningModel Compression	—Unverified	0
AlphaTuning: Quantization-Aware Parameter-Efficient Adaptation of Large-Scale Pre-Trained Language Models	Oct 8, 2022	Language ModelingLanguage Modelling	—Unverified	0
Less is More: Task-aware Layer-wise Distillation for Language Model Compression	Oct 4, 2022	Language ModelingLanguage Modelling	CodeCode Available	1
Basic Binary Convolution Unit for Binarized Image Restoration Network	Oct 2, 2022	BinarizationImage Restoration	CodeCode Available	1
Knowledge Distillation with Reptile Meta-Learning for Pretrained Language Model Compression	Oct 1, 2022	Knowledge DistillationLanguage Modeling	CodeCode Available	0
Multi-stage Progressive Compression of Conformer Transducer for On-device Speech Recognition	Oct 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Match to Win: Analysing Sequences Lengths for Efficient Self-supervised Learning in Speech and Audio	Sep 30, 2022	Model CompressionSelf-Supervised Learning	—Unverified	0
Attacking Compressed Vision Transformers	Sep 28, 2022	Model Compression	CodeCode Available	0
Efficient On-Device Session-Based Recommendation	Sep 27, 2022	Knowledge DistillationModel Compression	CodeCode Available	1
On-Device Domain Generalization	Sep 15, 2022	Data AugmentationDomain Generalization	CodeCode Available	2
Analysis of Quantization on MLP-based Vision Models	Sep 14, 2022	Model CompressionQuantization	—Unverified	0
PSAQ-ViT V2: Towards Accurate and General Data-Free Quantization for Vision Transformers	Sep 13, 2022	Data Free Quantizationimage-classification	CodeCode Available	1
DUET: A Tuning-Free Device-Cloud Collaborative Parameters Generation Framework for Efficient Device Model Generalization	Sep 12, 2022	Device-Cloud CollaborationDomain Adaptation	CodeCode Available	1
Towards Sparsification of Graph Neural Networks	Sep 11, 2022	image-classificationImage Classification	CodeCode Available	0
SaleNet: A low-power end-to-end CNN accelerator for sustained attention level evaluation using EEG	Sep 3, 2022	ClusteringEEG	—Unverified	0
Lottery Aware Sparsity Hunting: Enabling Federated Learning on Resource-Limited Edge	Aug 27, 2022	Federated LearningModel Compression	CodeCode Available	0
Complexity-Driven CNN Compression for Resource-constrained Edge AI	Aug 26, 2022	Computational EfficiencyModel Compression	—Unverified	0
Reducing Computational Complexity of Neural Networks in Optical Channel Equalization: From Concepts to Implementation	Aug 26, 2022	Bayesian OptimizationClustering	—Unverified	0
Optimal Brain Compression: A Framework for Accurate Post-Training Quantization and Pruning	Aug 24, 2022	Model CompressionQuantization	CodeCode Available	1
Robust and Large-Payload DNN Watermarking via Fixed, Distribution-Optimized, Weights	Aug 23, 2022	Model CompressionTransfer Learning	CodeCode Available	0
Design Automation for Fast, Lightweight, and Effective Deep Learning Models: A Survey	Aug 22, 2022	Deep LearningEdge-computing	—Unverified	0
Enhancing Targeted Attack Transferability via Diversified Weight Pruning	Aug 18, 2022	DiversityModel Compression	—Unverified	0
An Algorithm-Hardware Co-Optimized Framework for Accelerating N:M Sparse Transformers	Aug 12, 2022	Computational EfficiencyModel Compression	—Unverified	0
Safety and Performance, Why not Both? Bi-Objective Optimized Model Compression toward AI Software Deployment	Aug 11, 2022	Inference AttackMembership Inference Attack	CodeCode Available	0
Triple Sparsification of Graph Convolutional Networks without Sacrificing the Accuracy	Aug 6, 2022	Graph LearningModel Compression	—Unverified	0
Model Blending for Text Classification	Aug 5, 2022	ClassificationMachine Translation	—Unverified	0
Quiver neural networks	Jul 26, 2022	Model Compression	—Unverified	0
Efficient model compression with Random Operation Access Specific Tile (ROAST) hashing	Jul 21, 2022	Model Compression	CodeCode Available	0
Model Compression for Resource-Constrained Mobile Robots	Jul 20, 2022	Knowledge Distillationmodel	—Unverified	0
Towards Lightweight Super-Resolution with Dual Regression Learning	Jul 16, 2022	Image Super-ResolutionModel Compression	CodeCode Available	2
Communication-Efficient Diffusion Strategy for Performance Improvement of Federated Learning with Non-IID Data	Jul 15, 2022	Federated LearningModel Compression	CodeCode Available	1
T-RECX: Tiny-Resource Efficient Convolutional neural networks with early-eXit	Jul 14, 2022	image-classificationImage Classification	—Unverified	0
Normalized Feature Distillation for Semantic Segmentation	Jul 12, 2022	Knowledge DistillationModel Compression	—Unverified	0
3DG-STFM: 3D Geometric Guided Student-Teacher Feature Matching	Jul 6, 2022	Homography EstimationModel Compression	CodeCode Available	1
Rank-Based Filter Pruning for Real-Time UAV Tracking	Jul 5, 2022	Deep LearningModel Compression	—Unverified	0
CPrune: Compiler-Informed Model Pruning for Efficient Target-Aware DNN Execution	Jul 4, 2022	Compiler Optimizationimage-classification	CodeCode Available	1
Quantum Neural Network Compression	Jul 4, 2022	Model CompressionNeural Network Compression	—Unverified	0
KroneckerBERT: Significant Compression of Pre-trained Language Models Through Kronecker Decomposition and Knowledge Distillation	Jul 1, 2022	Knowledge DistillationLanguage Modeling	—Unverified	0
PCEE-BERT: Accelerating BERT Inference via Patient and Confident Early Exiting	Jul 1, 2022	Model Compression	CodeCode Available	0

Show:10 25 50

← PrevPage 13 of 28Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified