Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2576–2600 of 4925 papers

Title	Date	Tasks	Status
Compression of Deep Neural Networks for Image Instance Retrieval	Jan 18, 2017	Image Instance RetrievalModel Compression	—Unverified
Compression of Deep Neural Networks on the Fly	Sep 29, 2015	Object RecognitionQuantization	—Unverified
Compression of Generative Pre-trained Language Models via Quantization	Mar 21, 2022	Model CompressionQuantization	—Unverified
Compression of Recurrent Neural Networks for Efficient Language Modeling	Feb 6, 2019	Language ModelingLanguage Modelling	—Unverified
Compression of Site-Specific Deep Neural Networks for Massive MIMO Precoding	Feb 12, 2025	Neural Architecture SearchNeural Network Compression	—Unverified
Compression-Realized Deep Structural Network for Video Quality Enhancement	May 10, 2024	DenoisingMotion Estimation	—Unverified
Compression Scaling Laws:Unifying Sparsity and Quantization	Feb 23, 2025	Quantization	—Unverified
Compression strategies and space-conscious representations for deep neural networks	Jul 15, 2020	Quantizationregression	—Unverified
Compression without Quantization	Sep 25, 2019	DecoderImage Compression	—Unverified
Compressive Beam Alignment for Indoor Millimeter-Wave Systems	Jun 12, 2024	compressed sensingQuantization	—Unverified
Compressive Estimation of a Stochastic Process with Unknown Autocorrelation Function	May 9, 2017	Quantization	—Unverified
Compressive Quantization for Fast Object Instance Search in Videos	Oct 1, 2017	Instance SearchObject	—Unverified
Compressive Sensing Using Iterative Hard Thresholding with Low Precision Data Representation: Theory and Applications	Feb 14, 2018	AstronomyCompressive Sensing	—Unverified
Compressive Spectrum Sensing with 1-bit ADCs	Nov 7, 2024	compressed sensingQuantization	—Unverified
Compress Polyphone Pronunciation Prediction Model with Shared Labels	Oct 1, 2020	PredictionQuantization	—Unverified
Compress, Then Prompt: Improving Accuracy-Efficiency Trade-off of LLM Inference with Transferable Prompt	May 17, 2023	GPUModel Compression	—Unverified
Computability of Classification and Deep Learning: From Theoretical Limits to Practical Feasibility through Quantization	Aug 12, 2024	Deep LearningQuantization	—Unverified
Computational Complexity Evaluation of Neural Network Applications in Signal Processing	Jun 24, 2022	Quantization	—Unverified
Computation-Efficient Quantization Method for Deep Neural Networks	Sep 27, 2018	Quantization	—Unverified
Compute-Optimal LLMs Provably Generalize Better With Scale	Apr 21, 2025	Generalization BoundsQuantization	—Unverified
Computing with Hypervectors for Efficient Speaker Identification	Aug 28, 2022	CPUQuantization	—Unverified
Conditional Distribution Quantization in Machine Learning	Feb 11, 2025	QuantizationUncertainty Quantification	—Unverified
Conditionally Deep Hybrid Neural Networks Across Edge and Cloud	May 21, 2020	ClassificationCloud Computing	—Unverified
CoNLoCNN: Exploiting Correlation and Non-Uniform Quantization for Energy-Efficient Low-precision Deep Convolutional Neural Networks	Jul 31, 2022	Quantization	—Unverified
Constrained Approximate Similarity Search on Proximity Graph	Oct 26, 2022	QuantizationRecommendation Systems	—Unverified

Show:10 25 50

← PrevPage 104 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified