Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4451–4475 of 4925 papers

Title	Date	Tasks	Status
Adaptive Loss-aware Quantization for Multi-bit Networks	Dec 18, 2019	Quantization	CodeCode Available
Self-Supervised Learning for Color Spike Camera Reconstruction	Jan 1, 2025	Motion EstimationQuantization	CodeCode Available
Quantized Fisher Discriminant Analysis	Sep 6, 2019	BIG-bench Machine LearningDimensionality Reduction	CodeCode Available
OLALa: Online Learned Adaptive Lattice Codes for Heterogeneous Federated Learning	Jun 25, 2025	Federated LearningQuantization	CodeCode Available
Quantized Fourier and Polynomial Features for more Expressive Tensor Network Models	Sep 11, 2023	Quantization	CodeCode Available
Lipschitz Continuity Retained Binary Neural Network	Jul 13, 2022	BinarizationQuantization	CodeCode Available
Linearly Converging Error Compensated SGD	Oct 23, 2020	Quantization	CodeCode Available
Self-supervised Pre-training of Text Recognizers	May 1, 2024	QuantizationTransfer Learning	CodeCode Available
Explaining Reject Options of Learning Vector Quantization Classifiers	Feb 15, 2022	counterfactualQuantization	CodeCode Available
Self-supervised Product Quantization for Deep Unsupervised Image Retrieval	Sep 6, 2021	Contrastive LearningDescriptive	CodeCode Available
Deep Triplet Quantization	Feb 1, 2019	Deep HashingImage Retrieval	CodeCode Available
Deep Task-Based Analog-to-Digital Conversion	Jan 29, 2022	Meta-LearningQuantization	CodeCode Available
Lightweight Deep Learning Based Channel Estimation for Extremely Large-Scale Massive MIMO Systems	Feb 14, 2024	Quantization	CodeCode Available
Compositional Sketch Search	Jun 15, 2021	Image RetrievalPosition	CodeCode Available
Two-Step Quantization for Low-Bit Neural Networks	Jun 1, 2018	QuantizationVocal Bursts Valence Prediction	CodeCode Available
Composite Quantization	Dec 4, 2017	Quantization	CodeCode Available
On-Device Language Models: A Comprehensive Review	Aug 26, 2024	Knowledge DistillationQuantization	CodeCode Available
Communication Efficient Private Federated Learning Using Dithering	Sep 14, 2023	Federated LearningQuantization	CodeCode Available
On-Device LLM for Context-Aware Wi-Fi Roaming	May 7, 2025	Language ModelingLanguage Modelling	CodeCode Available
Communication-Efficient Multi-Device Inference Acceleration for Transformer Models	May 25, 2025	Quantization	CodeCode Available
Lightweight Client-Side Chinese/Japanese Morphological Analyzer Based on Online Learning	Aug 1, 2014	Domain AdaptationMorphological Analysis	CodeCode Available
DeepShift: Towards Multiplication-Less Neural Networks	May 30, 2019	Edge-computingGPU	CodeCode Available
Algorithm-Hardware Co-Design of Distribution-Aware Logarithmic-Posit Encodings for Efficient DNN Inference	Mar 8, 2024	Quantization	CodeCode Available
Bag of Tricks for Optimizing Transformer Efficiency	Sep 9, 2021	CPUDecoder	CodeCode Available
Towards Efficient Verification of Quantized Neural Networks	Dec 20, 2023	Heuristic SearchQuantization	CodeCode Available

Show:10 25 50

← PrevPage 179 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified