Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3426–3450 of 4925 papers

Title	Date	Tasks	Status
Accelerating RNN-based Speech Enhancement on a Multi-Core MCU with Mixed FP16-INT8 Post-Training Quantization	Oct 14, 2022	QuantizationSpeech Enhancement	—Unverified
Acceleration for Compressed Gradient Descent in Distributed Optimization	Jan 1, 2020	Distributed OptimizationFederated Learning	—Unverified
Acceleration of Convolutional Neural Network Using FFT-Based Split Convolutions	Mar 27, 2020	Quantization	—Unverified
Accelerator-Aware Training for Transducer-Based Speech Recognition	May 12, 2023	CPUQuantization	—Unverified
AccLLM: Accelerating Long-Context LLM Inference Via Algorithm-Hardware Co-Design	Apr 7, 2025	Quantization	—Unverified
Accumulator-Aware Post-Training Quantization	Sep 25, 2024	image-classificationImage Classification	—Unverified
Accuracy is Not All You Need	Jul 12, 2024	AllQuantization	—Unverified
Accuracy to Throughput Trade-offs for Reduced Precision Neural Networks on Reconfigurable Logic	Jul 17, 2018	Quantization	—Unverified
Accurate Block Quantization in LLMs with Outliers	Mar 29, 2024	Quantization	—Unverified
Accurate Compression of Text-to-Image Diffusion Models via Vector Quantization	Aug 31, 2024	Image GenerationQuantization	—Unverified
Accurate Deep Representation Quantization with Gradient Snapping Layer for Similarity Search	Oct 30, 2016	Quantization	—Unverified
Accurate INT8 Training Through Dynamic Block-Level Fallback	Mar 11, 2025	Quantization	—Unverified
Accurate Sine-Wave Amplitude Measurements Using Nonlinearly Quantized Data	Apr 28, 2018	Quantization	—Unverified
A Channelized Binning Method for Extraction of Dominant Color Pixel Value	May 28, 2016	Quantization	—Unverified
Achieving binary weight and activation for LLMs using Post-Training Quantization	Apr 7, 2025	Quantization	—Unverified
Achieving Robustness in Blind Modulo Analog-to-Digital Conversion	Dec 24, 2024	Quantization	—Unverified
Differentially Quantized Gradient Methods	Feb 6, 2020	Distributed OptimizationQuantization	—Unverified
Lean classical-quantum hybrid neural network model for image classification	Dec 3, 2024	ClassificationDecision Making	—Unverified
A Closed-loop Sleep Modulation System with FPGA-Accelerated Deep Learning	Nov 19, 2022	EEGElectroencephalogram (EEG)	—Unverified
A CNN-based Prediction-Aware Quality Enhancement Framework for VVC	May 12, 2021	Quantization	—Unverified
A Genetic Algorithm Approach for ImageRepresentation Learning through Color Quantization	Nov 18, 2017	Content-Based Image RetrievalImage Description	—Unverified
A Compact and Discriminative Face Track Descriptor	Jun 1, 2014	BinarizationDimensionality Reduction	—Unverified
A comparative study of several parameterizations for speaker recognition	Feb 24, 2022	QuantizationSpeaker Recognition	—Unverified
A comparative study of several ADPCM schemes with linear and nonlinear prediction	Mar 7, 2022	PredictionQuantization	—Unverified
A comparison study of CNN denoisers on PRNU extraction	Dec 6, 2021	DenoisingImage Denoising	—Unverified

Show:10 25 50

← PrevPage 138 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified