Network Pruning

Network Pruning is a popular approach to reduce a heavy network to obtain a light-weight form by removing redundancy in the heavy network. In this approach, a complex over-parameterized network is first trained, then pruned based on come criterions, and finally fine-tuned to achieve comparable performance with reduced parameters.

Source: Ensemble Knowledge Distillation for Learning Improved and Efficient Networks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 126–150 of 534 papers

Title	Date	Tasks	Status
Exploring Neural Network Pruning with Screening Methods	Feb 11, 2025	Edge-computingNetwork Pruning	—Unverified
B-FPGM: Lightweight Face Detection via Bayesian-Optimized Soft FPGM Pruning	Jan 28, 2025	Bayesian OptimizationFace Detection	CodeCode Available
Compact Bayesian Neural Networks via pruned MCMC sampling	Jan 12, 2025	Network PruningUncertainty Quantification	CodeCode Available
Neural Architecture Codesign for Fast Physics Applications	Jan 9, 2025	High-Level SynthesisModel Compression	CodeCode Available
Scalable iterative pruning of large language and vision models using block coordinate descent	Nov 26, 2024	Combinatorial OptimizationNetwork Pruning	—Unverified
Adapting the Biological SSVEP Response to Artificial Neural Networks	Nov 15, 2024	Decision MakingExplainable artificial intelligence	—Unverified
Complexity-Aware Training of Deep Neural Networks for Optimal Structure Discovery	Nov 14, 2024	Network PruningStochastic Optimization	—Unverified
Zeroth-Order Adaptive Neuron Alignment Based Pruning without Re-Training	Nov 11, 2024	Language ModelingLanguage Modelling	CodeCode Available
Mutual Information Preserving Neural Network Pruning	Oct 31, 2024	Network Pruning	—Unverified
Small Contributions, Small Networks: Efficient Neural Network Pruning Based on Relative Importance	Oct 21, 2024	Efficient Neural NetworkNetwork Pruning	—Unverified
LLM-Rank: A Graph Theoretical Approach to Pruning Large Language Models	Oct 17, 2024	Inference OptimizationNetwork Pruning	CodeCode Available
Efficient Multi-Object Tracking on Edge Devices via Reconstruction-Based Channel Pruning	Oct 11, 2024	Edge-computingMulti-Object Tracking	—Unverified
Personalized Federated Learning for Generative AI-Assisted Semantic Communications	Oct 3, 2024	Federated LearningNetwork Pruning	—Unverified
Aggressive Post-Training Compression on Extremely Large Language Models	Sep 30, 2024	Model CompressionNetwork Pruning	—Unverified
Investigating the Effect of Network Pruning on Performance and Interpretability	Sep 29, 2024	Network Pruning	CodeCode Available
CFSP: An Efficient Structured Pruning Framework for LLMs with Coarse-to-Fine Activation Information	Sep 20, 2024	Network Pruning	CodeCode Available
3D Point Cloud Network Pruning: When Some Weights Do not Matter	Aug 26, 2024	Network Pruning	CodeCode Available
A Greedy Hierarchical Approach to Whole-Network Filter-Pruning in CNNs	Aug 22, 2024	Network Pruning	—Unverified
Confident magnitude-based neural network pruning	Aug 8, 2024	Network PruningUncertainty Quantification	—Unverified
Mini-batch Coresets for Memory-efficient Training of Large Language Models	Jul 28, 2024	GPUNetwork Pruning	—Unverified
Comprehensive Study on Performance Evaluation and Optimization of Model Compression: Bridging Traditional Deep Learning and Large Language Models	Jul 22, 2024	Deep Learningimage-classification	—Unverified
CCSRP: Robust Pruning of Spiking Neural Networks through Cooperative Coevolution	Jul 18, 2024	Evolutionary AlgorithmsNetwork Pruning	—Unverified
Towards Lightweight Graph Neural Network Search with Curriculum Graph Sparsification	Jun 24, 2024	Graph Neural NetworkNetwork Pruning	—Unverified
Finding Task-specific Subnetworks in Multi-task Spoken Language Understanding Model	Jun 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Bypass Back-propagation: Optimization-based Structural Pruning for Large Language Models via Policy Gradient	Jun 15, 2024	GPUNetwork Pruning	—Unverified

Show:10 25 50

← PrevPage 6 of 22Next →

All datasets ImageNet ImageNet - ResNet 50 - 90% sparsity CIFAR-100 CIFAR-10 MNIST

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ResNet50-2.3 GFLOPs	Accuracy	78.79	—	Unverified
2	ResNet50-1.5 GFLOPs	Accuracy	78.07	—	Unverified
3	ResNet50 2.5 GFLOPS	Accuracy	78	—	Unverified
4	RegX-1.6G	Accuracy	77.97	—	Unverified
5	ResNet50 2.0 GFLOPS	Accuracy	77.7	—	Unverified
6	ResNet50-3G FLOPs	Accuracy	77.1	—	Unverified
7	ResNet50-2G FLOPs	Accuracy	76.4	—	Unverified
8	ResNet50-1G FLOPs	Accuracy	76.38	—	Unverified
9	TAS-pruned ResNet-50	Accuracy	76.2	—	Unverified
10	ResNet50	Accuracy	75.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Feather	Top-1 Accuracy	76.93	—	Unverified
2	Spartan	Top-1 Accuracy	76.17	—	Unverified
3	ST-3	Top-1 Accuracy	76.03	—	Unverified
4	AC/DC	Top-1 Accuracy	75.64	—	Unverified
5	CS	Top-1 Accuracy	75.5	—	Unverified
6	ProbMask	Top-1 Accuracy	74.68	—	Unverified
7	STR	Top-1 Accuracy	74.31	—	Unverified
8	DNW	Top-1 Accuracy	74	—	Unverified
9	GMP	Top-1 Accuracy	73.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	+U-DML*	Inference Time (ms)	675.56	—	Unverified
2	Dense	Accuracy	79	—	Unverified
3	AC/DC	Accuracy	78.2	—	Unverified
4	Beta-Rank	Accuracy	74.01	—	Unverified
5	TAS-pruned ResNet-110	Accuracy	73.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TAS-pruned ResNet-110	Accuracy	94.33	—	Unverified
2	ShuffleNet – Quantised	Inference Time (ms)	23.15	—	Unverified
3	AlexNet – Quantised	Inference Time (ms)	5.23	—	Unverified
4	MobileNet – Quantised	Inference Time (ms)	4.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FFN-ShapleyPruned	Avg #Steps	12.05	—	Unverified