Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 801–825 of 4925 papers

Title	Date	Tasks	Status	Hype
Deep Transferring Quantization	Aug 1, 2020	Face Recognitionimage-classification	CodeCode Available	1
Deep PeNSieve: A deep learning framework based on the posit number system	Jul 1, 2020	Quantization	CodeCode Available	1
Deep Geometry Post-Processing for Decompressed Point Clouds	Apr 29, 2022	Quantization	CodeCode Available	1
QCM-SGM+: Improved Quantized Compressed Sensing With Score-Based Generative Models	Feb 2, 2023	Bayesian Inferencecompressed sensing	CodeCode Available	1
Deep Learning-Enabled One-Bit DoA Estimation	May 15, 2024	compressed sensingDeep Learning	CodeCode Available	1
DenseShift: Towards Accurate and Efficient Low-Bit Power-of-Two Quantization	Aug 20, 2022	QuantizationTransfer Learning	CodeCode Available	1
Mixed Precision DNNs: All you need is a good parametrization	May 27, 2019	AllQuantization	CodeCode Available	1
Data-Free Quantization Through Weight Equalization and Bias Correction	Jun 11, 2019	Data Free Quantizationobject-detection	CodeCode Available	1
DAQ: Channel-Wise Distribution-Aware Quantization for Deep Image Super-Resolution Networks	Dec 21, 2020	Image Super-ResolutionQuantization	CodeCode Available	1
QONNX: Representing Arbitrary-Precision Quantized Neural Networks	Jun 15, 2022	Quantization	CodeCode Available	1
Data-Free Network Quantization With Adversarial Knowledge Distillation	May 8, 2020	Knowledge DistillationModel Compression	CodeCode Available	1
CNN-based first quantization estimation of double compressed JPEG images	Nov 1, 2022	Quantization	CodeCode Available	1
QSync: Quantization-Minimized Synchronous Distributed Training Across Hybrid Devices	Jul 2, 2024	GPUQuantization	CodeCode Available	1
QT-DoG: Quantization-aware Training for Domain Generalization	Oct 8, 2024	Domain GeneralizationModel Compression	CodeCode Available	1
Dataset Quantization with Active Learning based Adaptive Sampling	Jul 9, 2024	Active LearningDataset Distillation	CodeCode Available	1
CycleVAR: Repurposing Autoregressive Model for Unsupervised One-Step Image Translation	Jun 29, 2025	Image GenerationImage-to-Image Translation	CodeCode Available	1
QuantFace: Towards Lightweight Face Recognition by Synthetic Data Low-bit Quantization	Jun 21, 2022	Face RecognitionLightweight Face Recognition	CodeCode Available	1
CoCoFL: Communication- and Computation-Aware Federated Learning via Partial NN Freezing and Quantization	Mar 10, 2022	FairnessFederated Learning	CodeCode Available	1
D^2-DPM: Dual Denoising for Quantized Diffusion Probabilistic Models	Jan 14, 2025	DenoisingImage Generation	CodeCode Available	1
Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference	Dec 15, 2017	General ClassificationQuantization	CodeCode Available	1
Codebook Features: Sparse and Discrete Interpretability for Neural Networks	Oct 26, 2023	Quantization	CodeCode Available	1
Unbiased Single-scale and Multi-scale Quantizers for Distributed Optimization	Sep 26, 2021	BIG-bench Machine LearningDistributed Optimization	CodeCode Available	1
CPLLM: Clinical Prediction with Large Language Models	Sep 20, 2023	Disease PredictionLanguage Modeling	CodeCode Available	1
CrAM: A Compression-Aware Minimizer	Jul 28, 2022	GPUImage Classification	CodeCode Available	1
DeCoAR 2.0: Deep Contextualized Acoustic Representations with Vector Quantization	Dec 11, 2020	DiversityQuantization	CodeCode Available	1

Show:10 25 50

← PrevPage 33 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified