Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1026–1050 of 4925 papers

Title	Date	Tasks	Status
Compress Polyphone Pronunciation Prediction Model with Shared Labels	Oct 1, 2020	PredictionQuantization	—Unverified
A Fast Network Exploration Strategy to Profile Low Energy Consumption for Keyword Spotting	Feb 4, 2022	Keyword SpottingQuantization	—Unverified
Compressive Spectrum Sensing with 1-bit ADCs	Nov 7, 2024	compressed sensingQuantization	—Unverified
Compressive Sensing Using Iterative Hard Thresholding with Low Precision Data Representation: Theory and Applications	Feb 14, 2018	AstronomyCompressive Sensing	—Unverified
Compressive Quantization for Fast Object Instance Search in Videos	Oct 1, 2017	Instance SearchObject	—Unverified
Compressive Estimation of a Stochastic Process with Unknown Autocorrelation Function	May 9, 2017	Quantization	—Unverified
Associative Memories to Accelerate Approximate Nearest Neighbor Search	Nov 10, 2016	QuantizationRetrieval	—Unverified
A Faster Approach to Spiking Deep Convolutional Neural Networks	Oct 31, 2022	Dimensionality ReductionQuantization	—Unverified
Accuracy to Throughput Trade-offs for Reduced Precision Neural Networks on Reconfigurable Logic	Jul 17, 2018	Quantization	—Unverified
Compressive Beam Alignment for Indoor Millimeter-Wave Systems	Jun 12, 2024	compressed sensingQuantization	—Unverified
Compression without Quantization	Sep 25, 2019	DecoderImage Compression	—Unverified
A Speed Odyssey for Deployable Quantization of LLMs	Nov 16, 2023	Language ModelingLanguage Modelling	—Unverified
Compression strategies and space-conscious representations for deep neural networks	Jul 15, 2020	Quantizationregression	—Unverified
Adverse Weather Removal with Codebook Priors	Jan 1, 2023	Quantization	—Unverified
Compression Scaling Laws:Unifying Sparsity and Quantization	Feb 23, 2025	Quantization	—Unverified
Compression-Realized Deep Structural Network for Video Quality Enhancement	May 10, 2024	DenoisingMotion Estimation	—Unverified
A SOT-MRAM-based Processing-In-Memory Engine for Highly Compressed DNN Implementation	Nov 24, 2019	Model CompressionQuantization	—Unverified
Compression of Site-Specific Deep Neural Networks for Massive MIMO Precoding	Feb 12, 2025	Neural Architecture SearchNeural Network Compression	—Unverified
Compression of Recurrent Neural Networks for Efficient Language Modeling	Feb 6, 2019	Language ModelingLanguage Modelling	—Unverified
ASI++: Towards Distributionally Balanced End-to-End Generative Retrieval	May 23, 2024	Information RetrievalQuantization	—Unverified
Sparsity Turns Adversarial: Energy and Latency Attacks on Deep Neural Networks	Jun 14, 2020	Computational EfficiencyQuantization	—Unverified
3LC: Lightweight and Effective Traffic Compression for Distributed Machine Learning	Feb 21, 2018	BIG-bench Machine LearningData Compression	—Unverified
Designing a Classifier for Active Fire Detection from Multispectral Satellite Imagery Using Neural Architecture Search	Oct 7, 2024	Fire DetectionNeural Architecture Search	—Unverified
Compression of Generative Pre-trained Language Models via Quantization	Mar 21, 2022	Model CompressionQuantization	—Unverified
Compression of Deep Neural Networks on the Fly	Sep 29, 2015	Object RecognitionQuantization	—Unverified

Show:10 25 50

← PrevPage 42 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified