Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4501–4525 of 4925 papers

Title	Date	Tasks	Status
Quantizing deep convolutional networks for efficient inference: A whitepaper	Jun 21, 2018	Quantization	CodeCode Available
A2Q: Accumulator-Aware Quantization with Guaranteed Overflow Avoidance	Aug 25, 2023	Quantization	CodeCode Available
Deep residual network for steganalysis of digital images	Sep 23, 2018	Image SteganographyQuantization	CodeCode Available
LegalEval-Q: A New Benchmark for The Quality Evaluation of LLM-Generated Legal Text	May 30, 2025	Quantization	CodeCode Available
Ultrafast jet classification on FPGAs for the HL-LHC	Feb 2, 2024	Quantization	CodeCode Available
Large Scale Clustering with Variational EM for Gaussian Mixture Models	Oct 1, 2018	BenchmarkingClustering	CodeCode Available
QuantNAS for super resolution: searching for efficient quantization-friendly architectures against quantization noise	Aug 31, 2022	Efficient Neural NetworkImage Super-Resolution	CodeCode Available
Towards Learning of Filter-Level Heterogeneous Compression of Convolutional Neural Networks	Apr 22, 2019	Network PruningNeural Architecture Search	CodeCode Available
AdaBits: Neural Network Quantization with Adaptive Bit-Widths	Dec 20, 2019	Quantization	CodeCode Available
Bit Error Robustness for Energy-Efficient DNN Accelerators	Jun 24, 2020	Quantization	CodeCode Available
Towards Lossless ANN-SNN Conversion under Ultra-Low Latency with Dual-Phase Optimization	May 16, 2022	object-detectionObject Detection	CodeCode Available
Communication-Efficient Distributed Blockwise Momentum SGD with Error-Feedback	May 27, 2019	Quantization	CodeCode Available
Deep Recurrent Quantization for Generating Sequential Binary Codes	Jun 16, 2019	Image RetrievalQuantization	CodeCode Available
Exact Backpropagation in Binary Weighted Networks with Group Weight Transformations	Jul 3, 2021	BinarizationClassification with Binary Weight Network	CodeCode Available
Automated Cancer Subtyping via Vector Quantization Mutual Information Maximization	Jun 22, 2022	ClusteringQuantization	CodeCode Available
Deep Priority Hashing	Sep 4, 2018	Deep HashingImage Retrieval	CodeCode Available
On Quantizing Neural Representation for Variable-Rate Video Coding	Feb 17, 2025	Quantization	CodeCode Available
Evaluating Single Event Upsets in Deep Neural Networks for Semantic Segmentation: an embedded system perspective	Dec 4, 2024	Autonomous DrivingQuantization	CodeCode Available
Evaluating Quantized Large Language Models for Code Generation on Low-Resource Language Benchmarks	Oct 18, 2024	Code GenerationGPU	CodeCode Available
On Resource-Efficient Bayesian Network Classifiers and Deep Neural Networks	Oct 22, 2020	Quantization	CodeCode Available
Communication-Censored Distributed Stochastic Gradient Descent	Sep 9, 2019	QuantizationStochastic Optimization	CodeCode Available
Agile-Quant: Activation-Guided Quantization for Faster Inference of LLMs on the Edge	Dec 9, 2023	Language ModelingLanguage Modelling	CodeCode Available
Evaluating Large Language Models on the Frame and Symbol Grounding Problems: A Zero-shot Benchmark	Jun 9, 2025	Quantization	CodeCode Available
Deep Optimized Multiple Description Image Coding via Scalar Quantization Learning	Jan 12, 2020	DecoderQuantization	CodeCode Available
SHE: A Fast and Accurate Deep Neural Network for Encrypted Data	Jun 1, 2019	Quantization	CodeCode Available

Show:10 25 50

← PrevPage 181 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified