Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1101–1125 of 4925 papers

Title	Date	Tasks	Status	Score
Characterizing and Understanding the Behavior of Quantized Models for Reliable Deployment	Apr 8, 2022	Image to textLanguage Modeling	CodeCode Available	5
Learning Space Partitions for Nearest Neighbor Search	Jan 24, 2019	General Classificationgraph partitioning	CodeCode Available	5
Learning to Seek: Autonomous Source Seeking with Deep Reinforcement Learning Onboard a Nano Drone Microcontroller	Sep 25, 2019	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available	5
LFZip: Lossy compression of multivariate floating-point time series data via improved prediction	Nov 1, 2019	Data CompressionQuantization	CodeCode Available	5
Characteristics of networks generated by kernel growing neural gas	Aug 16, 2023	ClusteringQuantization	CodeCode Available	5
Learning Physical-Layer Communication with Quantized Feedback	Apr 19, 2019	Quantization	CodeCode Available	5
Adaptive Prediction-Powered AutoEval with Reliability and Efficiency Guarantees	May 24, 2025	Quantization	CodeCode Available	5
Channel-wise Mixed-precision Assignment for DNN Inference on Constrained Edge Nodes	Jun 17, 2022	Neural Architecture SearchQuantization	CodeCode Available	5
Learning Semantic Textual Similarity via Topic-informed Discrete Latent Variables	Nov 7, 2022	Language ModelingLanguage Modelling	CodeCode Available	5
Learning Convolutional Transforms for Lossy Point Cloud Geometry Compression	Mar 20, 2019	Binary ClassificationMixed Reality	CodeCode Available	5
Learning Frequency-Specific Quantization Scaling in VVC for Standard-Compliant Task-driven Image Coding	Jan 20, 2023	Quantization	CodeCode Available	5
Automatic Neural Network Compression by Sparsity-Quantization Joint Learning: A Constrained Optimization-based Approach	Oct 14, 2019	Neural Network CompressionQuantization	CodeCode Available	5
Learned transform compression with optimized entropy encoding	Apr 7, 2021	Quantization	CodeCode Available	5
An Underexplored Dilemma between Confidence and Calibration in Quantized Neural Networks	Nov 10, 2021	Decision MakingQuantization	CodeCode Available	5
Learning Accurate Low-Bit Deep Neural Networks with Stochastic Quantization	Aug 3, 2017	Quantization	CodeCode Available	5
Central Similarity Quantization for Efficient Image and Video Retrieval	Aug 1, 2019	QuantizationRetrieval	CodeCode Available	5
Accelerating and Compressing Deep Neural Networks for Massive MIMO CSI Feedback	Jan 20, 2023	Model CompressionNetwork Pruning	CodeCode Available	5
Language Models as Zero-shot Lossless Gradient Compressors: Towards General Neural Parameter Prior Models	Sep 26, 2024	Neural Network CompressionQuantization	CodeCode Available	5
Learning Accurate Performance Predictors for Ultrafast Automated Model Compression	Apr 13, 2023	image-classificationImage Classification	CodeCode Available	5
Langevin dynamics based algorithm e-THO POULA for stochastic optimization problems with discontinuous stochastic gradient	Oct 24, 2022	Portfolio OptimizationQuantization	CodeCode Available	5
KVTuner: Sensitivity-Aware Layer-wise Mixed Precision KV Cache Quantization for Efficient and Nearly Lossless LLM Inference	Feb 6, 2025	Mathematical ReasoningQuantization	CodeCode Available	5
KP2Dtiny: Quantized Neural Keypoint Detection and Description on the Edge	Jul 7, 2023	Homography EstimationKeypoint Detection	CodeCode Available	5
Causal-DFQ: Causality Guided Data-free Network Quantization	Sep 24, 2023	Data Free QuantizationNeural Network Compression	CodeCode Available	5
Cauchy-Schwarz Regularizers	Mar 3, 2025	Quantization	CodeCode Available	5
Large Scale Clustering with Variational EM for Gaussian Mixture Models	Oct 1, 2018	BenchmarkingClustering	CodeCode Available	5

Show:10 25 50

← PrevPage 45 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified