Model Compression

Model Compression is an actively pursued area of research over the last few years with the goal of deploying state-of-the-art deep networks in low-power and resource limited devices without significant drop in accuracy. Parameter pruning, low-rank factorization and weight quantization are some of the proposed methods to compress the size of deep networks.

Source: KD-MRI: A knowledge distillation framework for image reconstruction and image restoration in MRI workflow

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 701–750 of 1356 papers

Title	Date	Tasks	Status
SSDA: Secure Source-Free Domain Adaptation	Jan 1, 2023	Backdoor AttackDomain Adaptation	CodeCode Available
ICD-Face: Intra-class Compactness Distillation for Face Recognition	Jan 1, 2023	Face RecognitionKnowledge Distillation	—Unverified
Memory-Friendly Scalable Super-Resolution via Rewinding Lottery Ticket Hypothesis	Jan 1, 2023	image-classificationImage Classification	—Unverified
FlatENN: Train Flat for Enhanced Fault Tolerance of Quantized Deep Neural Networks	Dec 29, 2022	Model CompressionQuantization	—Unverified
BD-KD: Balancing the Divergences for Online Knowledge Distillation	Dec 25, 2022	Knowledge DistillationModel Compression	—Unverified
Spike encoding techniques for IoT time-varying signals benchmarked on a neuromorphic classification task	Dec 21, 2022	Model CompressionTransfer Learning	CodeCode Available
FSCNN: A Fast Sparse Convolution Neural Network Inference System	Dec 17, 2022	Model Compression	—Unverified
Swing Distillation: A Privacy-Preserving Knowledge Distillation Framework	Dec 16, 2022	Knowledge DistillationModel Compression	—Unverified
Can We Find Strong Lottery Tickets in Generative Models?	Dec 16, 2022	Model CompressionNetwork Pruning	—Unverified
Efficient Speech Representation Learning with Low-Bit Quantization	Dec 14, 2022	Model CompressionQuantization	—Unverified
Error-aware Quantization through Noise Tempering	Dec 11, 2022	Model CompressionQuantization	—Unverified
Leveraging Different Learning Styles for Improved Knowledge Distillation in Biomedical Imaging	Dec 6, 2022	Knowledge DistillationModel Compression	—Unverified
CSTAR: Towards Compact and STructured Deep Neural Networks with Adversarial Robustness	Dec 4, 2022	Adversarial RobustnessModel Compression	—Unverified
GlueFL: Reconciling Client Sampling and Model Masking for Bandwidth Efficient Federated Learning	Dec 3, 2022	Federated LearningModel Compression	—Unverified
Compressing Cross-Lingual Multi-Task Models at Qualtrics	Nov 29, 2022	ManagementModel Compression	—Unverified
Design and Prototyping Distributed CNN Inference Acceleration in Edge Computing	Nov 24, 2022	Distributed ComputingEdge-computing	—Unverified
Learning Low-Rank Representations for Model Compression	Nov 21, 2022	Clusteringmodel	—Unverified
Understanding and Improving Knowledge Distillation for Quantization-Aware Training of Large Transformer Encoders	Nov 20, 2022	Knowledge DistillationModel Compression	CodeCode Available
Is Smaller Always Faster? Tradeoffs in Compressing Self-Supervised Speech Transformers	Nov 17, 2022	Knowledge DistillationModel Compression	CodeCode Available
Edge-MultiAI: Multi-Tenancy of Latency-Sensitive Deep Learning Applications on Edge	Nov 14, 2022	ManagementModel Compression	—Unverified
Understanding the Role of Mixup in Knowledge Distillation: An Empirical Study	Nov 8, 2022	AttributeData Augmentation	CodeCode Available
XAI-BayesHAR: A novel Framework for Human Activity Recognition with Integrated Uncertainty and Shapely Values	Nov 7, 2022	Activity RecognitionExplainable Artificial Intelligence (XAI)	—Unverified
Model Compression for DNN-based Speaker Verification Using Weight Quantization	Oct 31, 2022	Model CompressionQuantization	—Unverified
COST-EFF: Collaborative Optimization of Spatial and Temporal Efficiency with Slenderized Multi-exit Language Models	Oct 27, 2022	Model Compression	CodeCode Available
Fast DistilBERT on CPUs	Oct 27, 2022	Knowledge DistillationModel Compression	—Unverified
Online Cross-Layer Knowledge Distillation on Graph Neural Networks with Deep Supervision	Oct 25, 2022	Knowledge DistillationModel Compression	—Unverified
Legal-Tech Open Diaries: Lesson learned on how to develop and deploy light-weight models in the era of humongous Language Models	Oct 24, 2022	Knowledge DistillationModel Compression	—Unverified
Outsourcing Training without Uploading Data via Efficient Collaborative Open-Source Sampling	Oct 23, 2022	Model Compression	—Unverified
Sub-network Multi-objective Evolutionary Algorithm for Filter Pruning	Oct 22, 2022	Combinatorial OptimizationEvolutionary Algorithms	—Unverified
Data-Model-Circuit Tri-Design for Ultra-Light Video Intelligence on Edge Devices	Oct 16, 2022	Model CompressionMulti-Object Tracking	—Unverified
FIT: A Metric for Model Sensitivity	Oct 16, 2022	modelModel Compression	—Unverified
SeKron: A Decomposition Method Supporting Many Factorization Structures	Oct 12, 2022	Model CompressionTensor Decomposition	—Unverified
Boosting Graph Neural Networks via Adaptive Knowledge Distillation	Oct 12, 2022	Graph ClassificationGraph Mining	—Unverified
Deep learning model compression using network sensitivity and gradients	Oct 11, 2022	Deep LearningModel Compression	—Unverified
AlphaTuning: Quantization-Aware Parameter-Efficient Adaptation of Large-Scale Pre-Trained Language Models	Oct 8, 2022	Language ModelingLanguage Modelling	—Unverified
Knowledge Distillation with Reptile Meta-Learning for Pretrained Language Model Compression	Oct 1, 2022	Knowledge DistillationLanguage Modeling	CodeCode Available
Multi-stage Progressive Compression of Conformer Transducer for On-device Speech Recognition	Oct 1, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Match to Win: Analysing Sequences Lengths for Efficient Self-supervised Learning in Speech and Audio	Sep 30, 2022	Model CompressionSelf-Supervised Learning	—Unverified
Attacking Compressed Vision Transformers	Sep 28, 2022	Model Compression	CodeCode Available
Analysis of Quantization on MLP-based Vision Models	Sep 14, 2022	Model CompressionQuantization	—Unverified
Towards Sparsification of Graph Neural Networks	Sep 11, 2022	image-classificationImage Classification	CodeCode Available
SaleNet: A low-power end-to-end CNN accelerator for sustained attention level evaluation using EEG	Sep 3, 2022	ClusteringEEG	—Unverified
Lottery Aware Sparsity Hunting: Enabling Federated Learning on Resource-Limited Edge	Aug 27, 2022	Federated LearningModel Compression	CodeCode Available
Complexity-Driven CNN Compression for Resource-constrained Edge AI	Aug 26, 2022	Computational EfficiencyModel Compression	—Unverified
Reducing Computational Complexity of Neural Networks in Optical Channel Equalization: From Concepts to Implementation	Aug 26, 2022	Bayesian OptimizationClustering	—Unverified
Robust and Large-Payload DNN Watermarking via Fixed, Distribution-Optimized, Weights	Aug 23, 2022	Model CompressionTransfer Learning	CodeCode Available
Design Automation for Fast, Lightweight, and Effective Deep Learning Models: A Survey	Aug 22, 2022	Deep LearningEdge-computing	—Unverified
Enhancing Targeted Attack Transferability via Diversified Weight Pruning	Aug 18, 2022	DiversityModel Compression	—Unverified
An Algorithm-Hardware Co-Optimized Framework for Accelerating N:M Sparse Transformers	Aug 12, 2022	Computational EfficiencyModel Compression	—Unverified
Safety and Performance, Why not Both? Bi-Objective Optimized Model Compression toward AI Software Deployment	Aug 11, 2022	Inference AttackMembership Inference Attack	CodeCode Available

Show:10 25 50

← PrevPage 15 of 28Next →

All datasets ImageNet QNLI

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ADLIK-MO-ResNet50+W4A4	Top-1	77.88	—	Unverified
2	ADLIK-MO-ResNet50+W3A4	Top-1	77.34	—	Unverified
3	ResNet-18 + 4bit-1dim model compression using DKM	Top-1	70.52	—	Unverified
4	MobileNet-v1 + 4bit-1dim model compression using DKM	Top-1	69.63	—	Unverified
5	ResNet-18 + 2bit-1dim model compression using DKM	Top-1	68.63	—	Unverified
6	MobileNet-v1 + 2bit-1dim model compression using DKM	Top-1	67.62	—	Unverified
7	ResNet-18 + 4bit-4dim model compression using DKM	Top-1	66.1	—	Unverified
8	ResNet-18 + 2bit-2dim model compression using DKM	Top-1	64.7	—	Unverified
9	MobileNet-v1 + 4bit-4dim model compression using DKM	Top-1	61.4	—	Unverified
10	ResNet-18 + 1bit-1dim model compression using DKM	Top-1	59.7	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	MobileBERT + 2bit-1dim model compression using DKM	Accuracy	82.13	—	Unverified
2	MobileBERT + 1bit-1dim model compression using DKM	Accuracy	63.17	—	Unverified