Network Pruning

Network Pruning is a popular approach to reduce a heavy network to obtain a light-weight form by removing redundancy in the heavy network. In this approach, a complex over-parameterized network is first trained, then pruned based on come criterions, and finally fine-tuned to achieve comparable performance with reduced parameters.

Source: Ensemble Knowledge Distillation for Learning Improved and Efficient Networks

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 534 papers

Title	Date	Tasks	Status	Hype
Hyperpruning: Efficient Search through Pruned Variants of Recurrent Neural Networks Leveraging Lyapunov Spectrum	Jun 9, 2025	Hyperparameter OptimizationNetwork Pruning	—Unverified	0
TSENOR: Highly-Efficient Algorithm for Finding Transposable N:M Sparse Masks	May 29, 2025	GPUNetwork Pruning	—Unverified	0
Hierarchical Safety Realignment: Lightweight Restoration of Safety in Pruned Large Vision-Language Models	May 22, 2025	Network Pruning	CodeCode Available	0
Adaptive Pruning of Deep Neural Networks for Resource-Aware Embedded Intrusion Detection on the Edge	May 20, 2025	Intrusion DetectionNetwork Pruning	CodeCode Available	0
Bi-LSTM based Multi-Agent DRL with Computation-aware Pruning for Agent Twins Migration in Vehicular Embodied AI Networks	May 9, 2025	AI AgentAutonomous Vehicles	—Unverified	0
Guiding Evolutionary AutoEncoder Training with Activation-Based Pruning Operators	May 8, 2025	DecoderNetwork Pruning	CodeCode Available	0
ReplaceMe: Network Simplification via Layer Pruning and Linear Transformations	May 5, 2025	Network Pruning	CodeCode Available	1
Optimization over Trained (and Sparse) Neural Networks: A Surrogate within a Surrogate	May 4, 2025	Network Pruning	—Unverified	0
Hyperflows: Pruning Reveals the Importance of Weights	Apr 6, 2025	Network Pruning	—Unverified	0
Boosting Large Language Models with Mask Fine-Tuning	Mar 27, 2025	Language ModelingLanguage Modelling	CodeCode Available	0
Lipschitz Constant Meets Condition Number: Learning Robust and Compact Deep Neural Networks	Mar 26, 2025	Adversarial RobustnessNetwork Pruning	—Unverified	0
Maximum Redundancy Pruning: A Principle-Driven Layerwise Sparsity Allocation for LLMs	Mar 24, 2025	Network Pruning	—Unverified	0
Finding Stable Subnetworks at Initialization with Dataset Distillation	Mar 23, 2025	Dataset DistillationLinear Mode Connectivity	—Unverified	0
Multi-Agent Actor-Critic with Harmonic Annealing Pruning for Dynamic Spectrum Access Systems	Mar 19, 2025	Decision MakingDeep Reinforcement Learning	—Unverified	0
Signal Collapse in One-Shot Pruning: When Sparse Models Fail to Distinguish Neural Representations	Feb 18, 2025	Network Pruning	—Unverified	0
NTP-INT: Network Traffic Prediction-Driven In-band Network Telemetry for High-load Switches	Feb 18, 2025	Deep Reinforcement LearningGraph Neural Network	—Unverified	0
An Efficient Row-Based Sparse Fine-Tuning	Feb 17, 2025	Feature ImportanceNetwork Pruning	—Unverified	0
Automatic Pruning via Structured Lasso with Class-wise Information	Feb 13, 2025	Network Pruning	—Unverified	0
Exploring Neural Network Pruning with Screening Methods	Feb 11, 2025	Edge-computingNetwork Pruning	—Unverified	0
B-FPGM: Lightweight Face Detection via Bayesian-Optimized Soft FPGM Pruning	Jan 28, 2025	Bayesian OptimizationFace Detection	CodeCode Available	0
Compact Bayesian Neural Networks via pruned MCMC sampling	Jan 12, 2025	Network PruningUncertainty Quantification	CodeCode Available	0
Neural Architecture Codesign for Fast Physics Applications	Jan 9, 2025	High-Level SynthesisModel Compression	CodeCode Available	0
Exploring GLU Expansion Ratios: A Study of Structured Pruning in LLaMA-3.2 Models	Dec 26, 2024	Computational EfficiencyNetwork Pruning	CodeCode Available	5
Scalable iterative pruning of large language and vision models using block coordinate descent	Nov 26, 2024	Combinatorial OptimizationNetwork Pruning	—Unverified	0
Adapting the Biological SSVEP Response to Artificial Neural Networks	Nov 15, 2024	Decision MakingExplainable artificial intelligence	—Unverified	0

Show:10 25 50

← PrevPage 1 of 22Next →

All datasets ImageNet ImageNet - ResNet 50 - 90% sparsity CIFAR-100 CIFAR-10 MNIST

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ResNet50-2.3 GFLOPs	Accuracy	78.79	—	Unverified
2	ResNet50-1.5 GFLOPs	Accuracy	78.07	—	Unverified
3	ResNet50 2.5 GFLOPS	Accuracy	78	—	Unverified
4	RegX-1.6G	Accuracy	77.97	—	Unverified
5	ResNet50 2.0 GFLOPS	Accuracy	77.7	—	Unverified
6	ResNet50-3G FLOPs	Accuracy	77.1	—	Unverified
7	ResNet50-2G FLOPs	Accuracy	76.4	—	Unverified
8	ResNet50-1G FLOPs	Accuracy	76.38	—	Unverified
9	TAS-pruned ResNet-50	Accuracy	76.2	—	Unverified
10	ResNet50	Accuracy	75.59	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Feather	Top-1 Accuracy	76.93	—	Unverified
2	Spartan	Top-1 Accuracy	76.17	—	Unverified
3	ST-3	Top-1 Accuracy	76.03	—	Unverified
4	AC/DC	Top-1 Accuracy	75.64	—	Unverified
5	CS	Top-1 Accuracy	75.5	—	Unverified
6	ProbMask	Top-1 Accuracy	74.68	—	Unverified
7	STR	Top-1 Accuracy	74.31	—	Unverified
8	DNW	Top-1 Accuracy	74	—	Unverified
9	GMP	Top-1 Accuracy	73.91	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	+U-DML*	Inference Time (ms)	675.56	—	Unverified
2	Dense	Accuracy	79	—	Unverified
3	AC/DC	Accuracy	78.2	—	Unverified
4	Beta-Rank	Accuracy	74.01	—	Unverified
5	TAS-pruned ResNet-110	Accuracy	73.16	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	TAS-pruned ResNet-110	Accuracy	94.33	—	Unverified
2	ShuffleNet – Quantised	Inference Time (ms)	23.15	—	Unverified
3	AlexNet – Quantised	Inference Time (ms)	5.23	—	Unverified
4	MobileNet – Quantised	Inference Time (ms)	4.74	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	FFN-ShapleyPruned	Avg #Steps	12.05	—	Unverified