Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4351–4375 of 4925 papers

Title	Date	Tasks	Status
LSQ++: Lower running time and higher recall in multi-codebook quantization	Sep 1, 2018	Quantization	CodeCode Available
Nearly Lossless Adaptive Bit Switching	Feb 3, 2025	Quantization	CodeCode Available
Scaling Image Tokenizers with Grouped Spherical Quantization	Dec 3, 2024	Quantization	CodeCode Available
Additive Noise Annealing and Approximation Properties of Quantized Neural Networks	May 24, 2019	image-classificationImage Classification	CodeCode Available
Discrete Cross-Modal Alignment Enables Zero-Shot Speech Translation	Oct 18, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
NestQuant: Post-Training Integer-Nesting Quantization for On-Device DNN	Jun 22, 2025	Quantization	CodeCode Available
LRQ: Optimizing Post-Training Quantization for Large Language Models by Learning Low-Rank Weight-Scaling Matrices	Jul 16, 2024	Quantization	CodeCode Available
Who's a Good Boy? Reinforcing Canine Behavior in Real-Time using Machine Learning	Jan 7, 2021	BIG-bench Machine Learningimage-classification	CodeCode Available
Unsupervised Speech Representation Pooling Using Vector Quantization	Apr 8, 2023	Emotion Recognitionintent-classification	CodeCode Available
xCOMET-lite: Bridging the Gap Between Efficiency and Quality in Learned MT Evaluation Metrics	Jun 20, 2024	Machine TranslationQuantization	CodeCode Available
LQ-Nets: Learned Quantization for Highly Accurate and Compact Deep Neural Networks	Jul 26, 2018	Quantization	CodeCode Available
Discrete, compositional, and symbolic representations through attractor dynamics	Oct 3, 2023	Quantization	CodeCode Available
NeUQI: Near-Optimal Uniform Quantization Parameter Initialization	May 23, 2025	Quantization	CodeCode Available
DiscQuant: A Quantization Method for Neural Networks Inspired by Discrepancy Theory	Jan 11, 2025	GSM8KQuantization	CodeCode Available
Neural Architecture Codesign for Fast Physics Applications	Jan 9, 2025	High-Level SynthesisModel Compression	CodeCode Available
Quantization-Based Regularization for Autoencoders	May 27, 2019	ClusteringDecoder	CodeCode Available
Digital and Hybrid Precoding Designs in Massive MIMO with Low-Resolution ADCs	Sep 26, 2024	Quantization	CodeCode Available
Quantization Effects on Neural Networks Perception: How would quantization change the perceptual field of vision models?	Mar 15, 2024	Quantization	CodeCode Available
Diffusion Models as Stochastic Quantization in Lattice Field Theory	Sep 29, 2023	Quantization	CodeCode Available
Comprehensive SNN Compression Using ADMM Optimization and Activity Regularization	Nov 3, 2019	Model CompressionQuantization	CodeCode Available
Comprehensive Comparisons of Uniform Quantization in Deep Image Compression	Mar 1, 2023	DecoderImage Compression	CodeCode Available
Extracting Usable Predictions from Quantized Networks through Uncertainty Quantification for OOD Detection	Mar 2, 2024	QuantizationUncertainty Quantification	CodeCode Available
Neural Network Activation Quantization with Bitwise Information Bottlenecks	Jun 9, 2020	Computational EfficiencyQuantization	CodeCode Available
Differentiable Soft Quantization: Bridging Full-Precision and Low-Bit Neural Networks	Aug 14, 2019	Quantization	CodeCode Available
Neural Network Assisted Lifting Steps For Improved Fully Scalable Lossy Image Compression in JPEG 2000	Mar 4, 2024	Image CompressionQuantization	CodeCode Available

Show:10 25 50

← PrevPage 175 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified