Network Pruning

Network Pruning is a popular approach to reduce a heavy network to obtain a light-weight form by removing redundancy in the heavy network. In this approach, a complex over-parameterized network is first trained, then pruned based on come criterions, and finally fine-tuned to achieve comparable performance with reduced parameters.

Source: Ensemble Knowledge Distillation for Learning Improved and Efficient Networks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 26–50 of 534 papers

Title	Date	Tasks	Status	Hype
Complexity-Aware Training of Deep Neural Networks for Optimal Structure Discovery	Nov 14, 2024	Network PruningStochastic Optimization	—Unverified	0
Zeroth-Order Adaptive Neuron Alignment Based Pruning without Re-Training	Nov 11, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
Mutual Information Preserving Neural Network Pruning	Oct 31, 2024	Network Pruning	—Unverified	0
Small Contributions, Small Networks: Efficient Neural Network Pruning Based on Relative Importance	Oct 21, 2024	Efficient Neural NetworkNetwork Pruning	—Unverified	0
LLM-Rank: A Graph Theoretical Approach to Pruning Large Language Models	Oct 17, 2024	Inference OptimizationNetwork Pruning	CodeCode Available	0
Efficient Multi-Object Tracking on Edge Devices via Reconstruction-Based Channel Pruning	Oct 11, 2024	Edge-computingMulti-Object Tracking	—Unverified	0
Is C4 Dataset Optimal for Pruning? An Investigation of Calibration Data for LLM Pruning	Oct 9, 2024	In-Context LearningNetwork Pruning	CodeCode Available	1
Personalized Federated Learning for Generative AI-Assisted Semantic Communications	Oct 3, 2024	Federated LearningNetwork Pruning	—Unverified	0
Aggressive Post-Training Compression on Extremely Large Language Models	Sep 30, 2024	Model CompressionNetwork Pruning	—Unverified	0
Investigating the Effect of Network Pruning on Performance and Interpretability	Sep 29, 2024	Network Pruning	CodeCode Available	0
MaskLLM: Learnable Semi-Structured Sparsity for Large Language Models	Sep 26, 2024	Large Language ModelModel Compression	CodeCode Available	2
OATS: Outlier-Aware Pruning Through Sparse and Low Rank Decomposition	Sep 20, 2024	CPUNetwork Pruning	CodeCode Available	1
CFSP: An Efficient Structured Pruning Framework for LLMs with Coarse-to-Fine Activation Information	Sep 20, 2024	Network Pruning	CodeCode Available	0
Adversarial Pruning: A Survey and Benchmark of Pruning Methods for Adversarial Robustness	Sep 2, 2024	Adversarial RobustnessNetwork Pruning	CodeCode Available	1
3D Point Cloud Network Pruning: When Some Weights Do not Matter	Aug 26, 2024	Network Pruning	CodeCode Available	0
A Greedy Hierarchical Approach to Whole-Network Filter-Pruning in CNNs	Aug 22, 2024	Network Pruning	—Unverified	0
Confident magnitude-based neural network pruning	Aug 8, 2024	Network PruningUncertainty Quantification	—Unverified	0
Investigating Sparsity in Recurrent Neural Networks	Jul 30, 2024	Machine TranslationNetwork Pruning	CodeCode Available	1
Mini-batch Coresets for Memory-efficient Training of Large Language Models	Jul 28, 2024	GPUNetwork Pruning	—Unverified	0
Comprehensive Study on Performance Evaluation and Optimization of Model Compression: Bridging Traditional Deep Learning and Large Language Models	Jul 22, 2024	Deep Learningimage-classification	—Unverified	0
CCSRP: Robust Pruning of Spiking Neural Networks through Cooperative Coevolution	Jul 18, 2024	Evolutionary AlgorithmsNetwork Pruning	—Unverified	0
Towards Lightweight Graph Neural Network Search with Curriculum Graph Sparsification	Jun 24, 2024	Graph Neural NetworkNetwork Pruning	—Unverified	0
Finding Task-specific Subnetworks in Multi-task Spoken Language Understanding Model	Jun 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Bypass Back-propagation: Optimization-based Structural Pruning for Large Language Models via Policy Gradient	Jun 15, 2024	GPUNetwork Pruning	—Unverified	0
Towards Efficient Deep Spiking Neural Networks Construction with Spiking Activity based Pruning	Jun 3, 2024	Model CompressionNetwork Pruning	—Unverified	0

Show:10 25 50

← PrevPage 2 of 22Next →

All datasets ImageNet ImageNet - ResNet 50 - 90% sparsity CIFAR-100 CIFAR-10 MNIST

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ResNet50-2.3 GFLOPs	Accuracy	78.79	—	Unverified
2	ResNet50-1.5 GFLOPs	Accuracy	78.07	—	Unverified
3	ResNet50 2.5 GFLOPS	Accuracy	78	—	Unverified
4	RegX-1.6G	Accuracy	77.97	—	Unverified
5	ResNet50 2.0 GFLOPS	Accuracy	77.7	—	Unverified
6	ResNet50-3G FLOPs	Accuracy	77.1	—	Unverified
7	ResNet50-2G FLOPs	Accuracy	76.4	—	Unverified
8	ResNet50-1G FLOPs	Accuracy	76.38	—	Unverified
9	TAS-pruned ResNet-50	Accuracy	76.2	—	Unverified
10	ResNet50	Accuracy	75.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Feather	Top-1 Accuracy	76.93	—	Unverified
2	Spartan	Top-1 Accuracy	76.17	—	Unverified
3	ST-3	Top-1 Accuracy	76.03	—	Unverified
4	AC/DC	Top-1 Accuracy	75.64	—	Unverified
5	CS	Top-1 Accuracy	75.5	—	Unverified
6	ProbMask	Top-1 Accuracy	74.68	—	Unverified
7	STR	Top-1 Accuracy	74.31	—	Unverified
8	DNW	Top-1 Accuracy	74	—	Unverified
9	GMP	Top-1 Accuracy	73.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	+U-DML*	Inference Time (ms)	675.56	—	Unverified
2	Dense	Accuracy	79	—	Unverified
3	AC/DC	Accuracy	78.2	—	Unverified
4	Beta-Rank	Accuracy	74.01	—	Unverified
5	TAS-pruned ResNet-110	Accuracy	73.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TAS-pruned ResNet-110	Accuracy	94.33	—	Unverified
2	ShuffleNet – Quantised	Inference Time (ms)	23.15	—	Unverified
3	AlexNet – Quantised	Inference Time (ms)	5.23	—	Unverified
4	MobileNet – Quantised	Inference Time (ms)	4.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FFN-ShapleyPruned	Avg #Steps	12.05	—	Unverified