Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3501–3525 of 4925 papers

Title	Date	Tasks	Status
AddNet: Deep Neural Networks Using FPGA-Optimized Multipliers	Nov 19, 2019	Quantization	—Unverified
A Deep Hashing Learning Network	Jul 16, 2015	Deep HashingQuantization	—Unverified
A Deep Learning Inference Scheme Based on Pipelined Matrix Multiplication Acceleration Design and Non-uniform Quantization	Oct 10, 2021	Edge-computingQ-Learning	—Unverified
ADFQ-ViT: Activation-Distribution-Friendly Post-Training Quantization for Vision Transformers	Jul 3, 2024	Attributeimage-classification	—Unverified
A Different View of Sigma-Delta Modulators Under the Lens of Pulse Frequency Modulation	Nov 12, 2023	Quantization	—Unverified
A Diffusion Model Based Quality Enhancement Method for HEVC Compressed Video	Nov 15, 2023	DecoderQuantization	—Unverified
A Directed-Evolution Method for Sparsification and Compression of Neural Networks with Application to Object Identification and Segmentation and considerations of optimal quantization using small number of bits	Jun 12, 2022	Quantization	—Unverified
ADMM Based Semi-Structured Pattern Pruning Framework For Transformer	Jul 11, 2024	CoLAQuantization	—Unverified
AdpQ: A Zero-shot Calibration Free Adaptive Post Training Quantization Method for LLMs	May 22, 2024	Privacy PreservingQuantization	—Unverified
Adversarial Attack on Deep Product Quantization Network for Image Retrieval	Feb 26, 2020	Adversarial AttackImage Retrieval	—Unverified
Adversarial Defenses via Vector Quantization	May 23, 2023	Quantization	—Unverified
Sparsity Turns Adversarial: Energy and Latency Attacks on Deep Neural Networks	Jun 14, 2020	Computational EfficiencyQuantization	—Unverified
Adverse Weather Removal with Codebook Priors	Jan 1, 2023	Quantization	—Unverified
A Faster Approach to Spiking Deep Convolutional Neural Networks	Oct 31, 2022	Dimensionality ReductionQuantization	—Unverified
A Fast Network Exploration Strategy to Profile Low Energy Consumption for Keyword Spotting	Feb 4, 2022	Keyword SpottingQuantization	—Unverified
A Feature-map Discriminant Perspective for Pruning Deep Neural Networks	May 28, 2020	Network PruningQuantization	—Unverified
A Federated Reinforcement Learning Method with Quantization for Cooperative Edge Caching in Fog Radio Access Networks	Jun 23, 2022	Deep Reinforcement LearningQuantization	—Unverified
A flexible, extensible software framework for model compression based on the LC algorithm	May 15, 2020	BIG-bench Machine LearningLow-rank compression	—Unverified
A Flexible, Extensible Software Framework for Neural Net Compression	Oct 20, 2018	Quantization	—Unverified
A Formalization of Image Vectorization by Region Merging	Sep 24, 2024	Image SegmentationQuantization	—Unverified
A General Error-Theoretical Analysis Framework for Constructing Compression Strategies	Feb 19, 2025	Quantization	—Unverified
A General Family of Stochastic Proximal Gradient Methods for Deep Learning	Jul 15, 2020	Quantization	—Unverified
A Generalized Zero-Shot Quantization of Deep Convolutional Neural Networks via Learned Weights Statistics	Dec 6, 2021	Quantization	—Unverified
Aggregated Learning: A Deep Learning Framework Based on Information-Bottleneck Vector Quantization	Jul 26, 2018	Image ClassificationQuantization	—Unverified
Aggregating empirical evidence from data strategy studies: a case on model quantization	May 1, 2025	GPUQuantization	—Unverified

Show:10 25 50

← PrevPage 141 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified