Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2751–2775 of 4925 papers

Title	Date	Tasks	Status
Delving into Channels: Exploring Hyperparameter Space of Channel Bit Widths with Linear Complexity	Sep 29, 2021	CPUQuantization	—Unverified
Demystifying and Generalizing BinaryConnect	Oct 25, 2021	Quantization	—Unverified
Demystifying Singular Defects in Large Language Models	Feb 10, 2025	Quantization	—Unverified
Conditional Denoising Diffusion Probabilistic Models for Data Reconstruction Enhancement in Wireless Communications	Oct 30, 2023	DenoisingQuantization	—Unverified
Deploying Large AI Models on Resource-Limited Devices with Split Federated Learning	Apr 12, 2025	Federated LearningQuantization	—Unverified
Deploy Large-Scale Deep Neural Networks in Resource Constrained IoT Devices with Local Quantization Region	May 24, 2018	Quantization	—Unverified
Deployment of Deep Neural Networks for Object Detection on Edge AI Devices with Runtime Optimization	Aug 18, 2021	2D Object Detection3D Object Detection	—Unverified
Energy-efficient Deployment of Deep Learning Applications on Cortex-M based Microcontrollers using Deep Compression	May 20, 2022	Quantization	—Unverified
Dequantization of a signal from two parallel quantized observations	Sep 12, 2024	Quantization	—Unverified
Derived Codebooks for High-Accuracy Nearest Neighbor Search	May 16, 2019	QuantizationVocal Bursts Intensity Prediction	—Unverified
DeRS: Towards Extremely Efficient Upcycled Mixture-of-Experts Models	Mar 3, 2025	Mixture-of-ExpertsQuantization	—Unverified
Design and Analysis of Hardware-limited Non-uniform Task-based Quantizers	Aug 16, 2022	Quantization	—Unverified
Design and Analysis of Uplink and Downlink Communications for Federated Learning	Dec 7, 2020	Federated LearningQuantization	—Unverified
Design Automation for Efficient Deep Learning Computing	Apr 24, 2019	Deep LearningQuantization	—Unverified
Design Flow of Accelerating Hybrid Extremely Low Bit-width Neural Network in Embedded FPGA	Jul 31, 2018	Edge-computingGPU	—Unverified
Designing a Classifier for Active Fire Detection from Multispectral Satellite Imagery Using Neural Architecture Search	Oct 7, 2024	Fire DetectionNeural Architecture Search	—Unverified
Designing Discontinuities	May 15, 2023	EconometricsQuantization	—Unverified
Designing DNNs for a trade-off between robustness and processing performance in embedded devices	Dec 4, 2024	Autonomous DrivingQuantization	—Unverified
Designing strong baselines for ternary neural network quantization through support and mass equalization	Jun 30, 2023	Quantization	—Unverified
Design of High-Throughput Mixed-Precision CNN Accelerators on FPGA	Aug 9, 2022	QuantizationVocal Bursts Intensity Prediction	—Unverified
Design of Sampling Set for Bandlimited Graph Signal Estimation	Nov 20, 2017	Experimental DesignQuantization	—Unverified
Design of Stochastic Quantizers for Privacy Preservation	Mar 5, 2024	Privacy PreservingQuantization	—Unverified
Design Space Exploration of Dense and Sparse Mapping Schemes for RRAM Architectures	Jan 18, 2022	Quantization	—Unverified
Design Space Exploration of Low-Bit Quantized Neural Networks for Visual Place Recognition	Dec 14, 2023	QuantizationVisual Place Recognition	—Unverified
Detecting Dead Weights and Units in Neural Networks	Jun 15, 2018	Quantization	—Unverified

Show:10 25 50

← PrevPage 111 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified