Network Pruning

Network Pruning is a popular approach to reduce a heavy network to obtain a light-weight form by removing redundancy in the heavy network. In this approach, a complex over-parameterized network is first trained, then pruned based on come criterions, and finally fine-tuned to achieve comparable performance with reduced parameters.

Source: Ensemble Knowledge Distillation for Learning Improved and Efficient Networks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 534 papers

Title	Date	Tasks	Status	Hype
Hyperpruning: Efficient Search through Pruned Variants of Recurrent Neural Networks Leveraging Lyapunov Spectrum	Jun 9, 2025	Hyperparameter OptimizationNetwork Pruning	—Unverified	0
TSENOR: Highly-Efficient Algorithm for Finding Transposable N:M Sparse Masks	May 29, 2025	GPUNetwork Pruning	—Unverified	0
Hierarchical Safety Realignment: Lightweight Restoration of Safety in Pruned Large Vision-Language Models	May 22, 2025	Network Pruning	CodeCode Available	0
Adaptive Pruning of Deep Neural Networks for Resource-Aware Embedded Intrusion Detection on the Edge	May 20, 2025	Intrusion DetectionNetwork Pruning	CodeCode Available	0
Bi-LSTM based Multi-Agent DRL with Computation-aware Pruning for Agent Twins Migration in Vehicular Embodied AI Networks	May 9, 2025	AI AgentAutonomous Vehicles	—Unverified	0
Guiding Evolutionary AutoEncoder Training with Activation-Based Pruning Operators	May 8, 2025	DecoderNetwork Pruning	CodeCode Available	0
ReplaceMe: Network Simplification via Layer Pruning and Linear Transformations	May 5, 2025	Network Pruning	CodeCode Available	1
Optimization over Trained (and Sparse) Neural Networks: A Surrogate within a Surrogate	May 4, 2025	Network Pruning	—Unverified	0
Hyperflows: Pruning Reveals the Importance of Weights	Apr 6, 2025	Network Pruning	—Unverified	0
Boosting Large Language Models with Mask Fine-Tuning	Mar 27, 2025	Language ModelingLanguage Modelling	CodeCode Available	0
Lipschitz Constant Meets Condition Number: Learning Robust and Compact Deep Neural Networks	Mar 26, 2025	Adversarial RobustnessNetwork Pruning	—Unverified	0
Maximum Redundancy Pruning: A Principle-Driven Layerwise Sparsity Allocation for LLMs	Mar 24, 2025	Network Pruning	—Unverified	0
Finding Stable Subnetworks at Initialization with Dataset Distillation	Mar 23, 2025	Dataset DistillationLinear Mode Connectivity	—Unverified	0
Multi-Agent Actor-Critic with Harmonic Annealing Pruning for Dynamic Spectrum Access Systems	Mar 19, 2025	Decision MakingDeep Reinforcement Learning	—Unverified	0
Signal Collapse in One-Shot Pruning: When Sparse Models Fail to Distinguish Neural Representations	Feb 18, 2025	Network Pruning	—Unverified	0
NTP-INT: Network Traffic Prediction-Driven In-band Network Telemetry for High-load Switches	Feb 18, 2025	Deep Reinforcement LearningGraph Neural Network	—Unverified	0
An Efficient Row-Based Sparse Fine-Tuning	Feb 17, 2025	Feature ImportanceNetwork Pruning	—Unverified	0
Automatic Pruning via Structured Lasso with Class-wise Information	Feb 13, 2025	Network Pruning	—Unverified	0
Exploring Neural Network Pruning with Screening Methods	Feb 11, 2025	Edge-computingNetwork Pruning	—Unverified	0
B-FPGM: Lightweight Face Detection via Bayesian-Optimized Soft FPGM Pruning	Jan 28, 2025	Bayesian OptimizationFace Detection	CodeCode Available	0
Compact Bayesian Neural Networks via pruned MCMC sampling	Jan 12, 2025	Network PruningUncertainty Quantification	CodeCode Available	0
Neural Architecture Codesign for Fast Physics Applications	Jan 9, 2025	High-Level SynthesisModel Compression	CodeCode Available	0
Exploring GLU Expansion Ratios: A Study of Structured Pruning in LLaMA-3.2 Models	Dec 26, 2024	Computational EfficiencyNetwork Pruning	CodeCode Available	5
Scalable iterative pruning of large language and vision models using block coordinate descent	Nov 26, 2024	Combinatorial OptimizationNetwork Pruning	—Unverified	0
Adapting the Biological SSVEP Response to Artificial Neural Networks	Nov 15, 2024	Decision MakingExplainable artificial intelligence	—Unverified	0
Complexity-Aware Training of Deep Neural Networks for Optimal Structure Discovery	Nov 14, 2024	Network PruningStochastic Optimization	—Unverified	0
Zeroth-Order Adaptive Neuron Alignment Based Pruning without Re-Training	Nov 11, 2024	Language ModelingLanguage Modelling	CodeCode Available	0
Mutual Information Preserving Neural Network Pruning	Oct 31, 2024	Network Pruning	—Unverified	0
Small Contributions, Small Networks: Efficient Neural Network Pruning Based on Relative Importance	Oct 21, 2024	Efficient Neural NetworkNetwork Pruning	—Unverified	0
LLM-Rank: A Graph Theoretical Approach to Pruning Large Language Models	Oct 17, 2024	Inference OptimizationNetwork Pruning	CodeCode Available	0
Efficient Multi-Object Tracking on Edge Devices via Reconstruction-Based Channel Pruning	Oct 11, 2024	Edge-computingMulti-Object Tracking	—Unverified	0
Is C4 Dataset Optimal for Pruning? An Investigation of Calibration Data for LLM Pruning	Oct 9, 2024	In-Context LearningNetwork Pruning	CodeCode Available	1
Personalized Federated Learning for Generative AI-Assisted Semantic Communications	Oct 3, 2024	Federated LearningNetwork Pruning	—Unverified	0
Aggressive Post-Training Compression on Extremely Large Language Models	Sep 30, 2024	Model CompressionNetwork Pruning	—Unverified	0
Investigating the Effect of Network Pruning on Performance and Interpretability	Sep 29, 2024	Network Pruning	CodeCode Available	0
MaskLLM: Learnable Semi-Structured Sparsity for Large Language Models	Sep 26, 2024	Large Language ModelModel Compression	CodeCode Available	2
OATS: Outlier-Aware Pruning Through Sparse and Low Rank Decomposition	Sep 20, 2024	CPUNetwork Pruning	CodeCode Available	1
CFSP: An Efficient Structured Pruning Framework for LLMs with Coarse-to-Fine Activation Information	Sep 20, 2024	Network Pruning	CodeCode Available	0
Adversarial Pruning: A Survey and Benchmark of Pruning Methods for Adversarial Robustness	Sep 2, 2024	Adversarial RobustnessNetwork Pruning	CodeCode Available	1
3D Point Cloud Network Pruning: When Some Weights Do not Matter	Aug 26, 2024	Network Pruning	CodeCode Available	0
A Greedy Hierarchical Approach to Whole-Network Filter-Pruning in CNNs	Aug 22, 2024	Network Pruning	—Unverified	0
Confident magnitude-based neural network pruning	Aug 8, 2024	Network PruningUncertainty Quantification	—Unverified	0
Investigating Sparsity in Recurrent Neural Networks	Jul 30, 2024	Machine TranslationNetwork Pruning	CodeCode Available	1
Mini-batch Coresets for Memory-efficient Training of Large Language Models	Jul 28, 2024	GPUNetwork Pruning	—Unverified	0
Comprehensive Study on Performance Evaluation and Optimization of Model Compression: Bridging Traditional Deep Learning and Large Language Models	Jul 22, 2024	Deep Learningimage-classification	—Unverified	0
CCSRP: Robust Pruning of Spiking Neural Networks through Cooperative Coevolution	Jul 18, 2024	Evolutionary AlgorithmsNetwork Pruning	—Unverified	0
Towards Lightweight Graph Neural Network Search with Curriculum Graph Sparsification	Jun 24, 2024	Graph Neural NetworkNetwork Pruning	—Unverified	0
Finding Task-specific Subnetworks in Multi-task Spoken Language Understanding Model	Jun 18, 2024	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Bypass Back-propagation: Optimization-based Structural Pruning for Large Language Models via Policy Gradient	Jun 15, 2024	GPUNetwork Pruning	—Unverified	0
Towards Efficient Deep Spiking Neural Networks Construction with Spiking Activity based Pruning	Jun 3, 2024	Model CompressionNetwork Pruning	—Unverified	0

Show:10 25 50

← PrevPage 1 of 11Next →

All datasets ImageNet ImageNet - ResNet 50 - 90% sparsity CIFAR-100 CIFAR-10 MNIST

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ResNet50-2.3 GFLOPs	Accuracy	78.79	—	Unverified
2	ResNet50-1.5 GFLOPs	Accuracy	78.07	—	Unverified
3	ResNet50 2.5 GFLOPS	Accuracy	78	—	Unverified
4	RegX-1.6G	Accuracy	77.97	—	Unverified
5	ResNet50 2.0 GFLOPS	Accuracy	77.7	—	Unverified
6	ResNet50-3G FLOPs	Accuracy	77.1	—	Unverified
7	ResNet50-2G FLOPs	Accuracy	76.4	—	Unverified
8	ResNet50-1G FLOPs	Accuracy	76.38	—	Unverified
9	TAS-pruned ResNet-50	Accuracy	76.2	—	Unverified
10	ResNet50	Accuracy	75.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Feather	Top-1 Accuracy	76.93	—	Unverified
2	Spartan	Top-1 Accuracy	76.17	—	Unverified
3	ST-3	Top-1 Accuracy	76.03	—	Unverified
4	AC/DC	Top-1 Accuracy	75.64	—	Unverified
5	CS	Top-1 Accuracy	75.5	—	Unverified
6	ProbMask	Top-1 Accuracy	74.68	—	Unverified
7	STR	Top-1 Accuracy	74.31	—	Unverified
8	DNW	Top-1 Accuracy	74	—	Unverified
9	GMP	Top-1 Accuracy	73.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	+U-DML*	Inference Time (ms)	675.56	—	Unverified
2	Dense	Accuracy	79	—	Unverified
3	AC/DC	Accuracy	78.2	—	Unverified
4	Beta-Rank	Accuracy	74.01	—	Unverified
5	TAS-pruned ResNet-110	Accuracy	73.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TAS-pruned ResNet-110	Accuracy	94.33	—	Unverified
2	ShuffleNet – Quantised	Inference Time (ms)	23.15	—	Unverified
3	AlexNet – Quantised	Inference Time (ms)	5.23	—	Unverified
4	MobileNet – Quantised	Inference Time (ms)	4.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FFN-ShapleyPruned	Avg #Steps	12.05	—	Unverified