Neural Network Compression

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 193 papers

Title	Date	Tasks	Status	Hype
DepGraph: Towards Any Structural Pruning	Jan 30, 2023	Network PruningNeural Network Compression	CodeCode Available	4
Torch2Chip: An End-to-end Customizable Deep Neural Network Compression and Deployment Toolkit for Prototype Hardware Accelerator Design	May 2, 2024	Model CompressionNeural Network Compression	CodeCode Available	2
A Survey on Deep Neural Network Pruning-Taxonomy, Comparison, Analysis, and Recommendations	Aug 13, 2023	Adversarial RobustnessNetwork Pruning	CodeCode Available	2
Neural Network Compression Framework for fast model inference	Feb 20, 2020	BinarizationCPU	CodeCode Available	2
Data-Free Learning of Student Networks	Apr 2, 2019	Neural Network Compression	CodeCode Available	2
Towards Meta-Pruning via Optimal Transport	Feb 12, 2024	Neural Network Compression	CodeCode Available	1
SwiftTron: An Efficient Hardware Accelerator for Quantized Transformers	Apr 8, 2023	Neural Network CompressionQuantization	CodeCode Available	1
PD-Quant: Post-Training Quantization based on Prediction Difference Metric	Dec 14, 2022	Neural Network CompressionQuantization	CodeCode Available	1
SPIN: An Empirical Evaluation on Sharing Parameters of Isotropic Networks	Jul 21, 2022	Neural Network Compression	CodeCode Available	1
Wavelet Feature Maps Compression for Image-to-Image CNNs	May 24, 2022	Depth EstimationNeural Network Compression	CodeCode Available	1
Few-Bit Backward: Quantized Gradients of Activation Functions for Memory Footprint Reduction	Feb 1, 2022	Neural Network CompressionQuantization	CodeCode Available	1
CHIP: CHannel Independence-based Pruning for Compact Neural Networks	Oct 26, 2021	Neural Network Compression	CodeCode Available	1
NeRV: Neural Representations for Videos	Oct 26, 2021	DenoisingNeural Network Compression	CodeCode Available	1
Prune Your Model Before Distill It	Sep 30, 2021	Knowledge Distillationmodel	CodeCode Available	1
Efficient Deep Learning: A Survey on Making Deep Learning Models Smaller, Faster, and Better	Jun 16, 2021	Deep LearningInformation Retrieval	CodeCode Available	1
Spectral Tensor Train Parameterization of Deep Learning Layers	Mar 7, 2021	Deep Learningimage-classification	CodeCode Available	1
FAT: Learning Low-Bitwidth Parametric Representation via Frequency-Aware Transformation	Feb 15, 2021	Model CompressionNeural Network Compression	CodeCode Available	1
Robustness and Transferability of Universal Attacks on Compressed Models	Dec 10, 2020	Neural Network CompressionQuantization	CodeCode Available	1
Head Network Distillation: Splitting Distilled Deep Neural Networks for Resource-Constrained Edge Computing Systems	Nov 20, 2020	Edge-computingimage-classification	CodeCode Available	1
T-Basis: a Compact Representation for Neural Networks	Jul 13, 2020	Neural Network CompressionTensor Networks	CodeCode Available	1
WoodFisher: Efficient Second-Order Approximation for Neural Network Compression	Apr 29, 2020	image-classificationImage Classification	CodeCode Available	1
Neural network compression via learnable wavelet transforms	Apr 20, 2020	Data CompressionNeural Network Compression	CodeCode Available	1
The continuous categorical: a novel simplex-valued exponential family	Feb 20, 2020	Neural Network CompressionTransfer Learning	CodeCode Available	1
REST: Robust and Efficient Neural Networks for Sleep Monitoring in the Wild	Jan 29, 2020	EEGElectroencephalogram (EEG)	CodeCode Available	1
Quantisation and Pruning for Neural Network Compression and Regularisation	Jan 14, 2020	Network PruningNeural Network Compression	CodeCode Available	1
ZeroQ: A Novel Zero Shot Quantization Framework	Jan 1, 2020	Data Free QuantizationModel Compression	CodeCode Available	1
Distilled Split Deep Neural Networks for Edge-Assisted Real-Time Systems	Oct 1, 2019	Edge-computingImage Classification	CodeCode Available	1
Learning Filter Basis for Convolutional Neural Network Compression	Aug 23, 2019	General Classificationimage-classification	CodeCode Available	1
Linearity-based neural network compression	Jun 26, 2025	Efficient Neural NetworkNeural Network Compression	—Unverified	0
MUC-G4: Minimal Unsat Core-Guided Incremental Verification for Deep Neural Network Compression	Jun 3, 2025	Neural Network CompressionQuantization	—Unverified	0
Is Quantum Optimization Ready? An Effort Towards Neural Network Compression using Adiabatic Quantum Computing	May 22, 2025	Model CompressionNeural Network Compression	—Unverified	0
Certified Neural Approximations of Nonlinear Dynamics	May 21, 2025	Neural Network Compression	CodeCode Available	0
Low-Rank Matrix Approximation for Neural Network Compression	Apr 25, 2025	Model CompressionNeural Network Compression	—Unverified	0
GranQ: Granular Zero-Shot Quantization with Channel-Wise Activation Scaling in QAT	Mar 24, 2025	Neural Network CompressionQuantization	—Unverified	0
Stabilizing Quantization-Aware Training by Implicit-Regularization on Hessian Matrix	Mar 14, 2025	Neural Network CompressionQuantization	—Unverified	0
Compression of Site-Specific Deep Neural Networks for Massive MIMO Precoding	Feb 12, 2025	Neural Architecture SearchNeural Network Compression	—Unverified	0
A Novel Structure-Agnostic Multi-Objective Approach for Weight-Sharing Compression in Deep Neural Networks	Jan 6, 2025	Neural Network CompressionQuantization	—Unverified	0
What is Left After Distillation? How Knowledge Transfer Impacts Fairness and Bias	Oct 10, 2024	Age/UnbiasedFairness	—Unverified	0
Efficient and Robust Knowledge Distillation from A Stronger Teacher Based on Correlation Matching	Oct 9, 2024	Knowledge DistillationNeural Network Compression	—Unverified	0
Language Models as Zero-shot Lossless Gradient Compressors: Towards General Neural Parameter Prior Models	Sep 26, 2024	Neural Network CompressionQuantization	CodeCode Available	0
Adaptive Error-Bounded Hierarchical Matrices for Efficient Neural Network Compression	Sep 11, 2024	Efficient Neural NetworkNeural Network Compression	—Unverified	0
TropNNC: Structured Neural Network Compression Using Tropical Geometry	Sep 5, 2024	Neural Network Compression	—Unverified	0
Unified Framework for Neural Network Compression via Decomposition and Optimal Rank Selection	Sep 5, 2024	Neural Network CompressionTensor Decomposition	—Unverified	0
Convolutional Neural Network Compression Based on Low-Rank Decomposition	Aug 29, 2024	Model CompressionNeural Network Compression	—Unverified	0
Condensed Sample-Guided Model Inversion for Knowledge Distillation	Aug 25, 2024	Knowledge Distillationmodel	—Unverified	0
An Efficient Real-Time Object Detection Framework on Resource-Constricted Hardware Devices via Software and Hardware Co-design	Aug 2, 2024	Model CompressionNeural Network Compression	—Unverified	0
Tiled Bit Networks: Sub-Bit Neural Network Compression Through Reuse of Learnable Binary Vectors	Jul 16, 2024	GPUNeural Network Compression	—Unverified	0
The Impact of Quantization and Pruning on Deep Reinforcement Learning Models	Jul 5, 2024	Deep Reinforcement LearningModel Compression	—Unverified	0
Neural Network Compression for Reinforcement Learning Tasks	May 13, 2024	Neural Network Compressionreinforcement-learning	—Unverified	0
Towards Explaining Deep Neural Network Compression Through a Probabilistic Latent Space	Feb 29, 2024	Neural Network Compression	—Unverified	0

Show:10 25 50

← PrevPage 1 of 4Next →

No leaderboard results yet.