Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2351–2375 of 4925 papers

Title	Date	Tasks	Status
A Novel Light Field Coding Scheme Based on Deep Belief Network & Weighted Binary Images for Additive Layered Displays	Oct 4, 2022	Mixed RealityQuantization	—Unverified
Efficient multivariate sequence classification	Sep 29, 2014	ClassificationGeneral Classification	—Unverified
CALM: Co-evolution of Algorithms and Language Model for Automatic Heuristic Design	May 18, 2025	GPULanguage Modeling	—Unverified
Efficient Match Kernel between Sets of Features for Visual Recognition	Dec 1, 2009	Quantization	—Unverified
Efficient Machine Translation with Model Pruning and Quantization	Nov 1, 2021	CPUDecoder	—Unverified
A Novel Hybrid Precoder With Low-Resolution Phase Shifters and Fronthaul Capacity Limitation	Jan 18, 2025	Quantization	—Unverified
Adaptive Integrate-and-Fire Time Encoding Machine with Quantization	Mar 5, 2024	Quantization	—Unverified
Efficiently Scaling Transformer Inference	Nov 9, 2022	Quantization	—Unverified
EfficientLLM: Efficiency in Large Language Models	May 20, 2025	Mixture-of-ExpertsQuantization	—Unverified
Efficient Learned Lossless JPEG Recompression	Aug 25, 2023	GPUImage Compression	—Unverified
Cactus Mechanisms: Optimal Differential Privacy Mechanisms in the Large-Composition Regime	Jun 25, 2022	Quantization	—Unverified
A Novel Framework for Image-to-image Translation and Image Compression	Nov 25, 2021	Image CompressionImage Generation	—Unverified
Efficient Large-Scale Approximate Nearest Neighbor Search on OpenCL FPGA	Jun 1, 2018	CPUGPU	—Unverified
Efficient Inferencing of Compressed Deep Neural Networks	Nov 1, 2017	Quantization	—Unverified
CacheQuant: Comprehensively Accelerated Diffusion Models	Jan 1, 2025	Image GenerationQuantization	—Unverified
A Novel Chaotic Uniform Quantizer for Speech Coding	Oct 11, 2018	Data CompressionQuantization	—Unverified
Accelerated Distance Computation with Encoding Tree for High Dimensional Data	Sep 17, 2015	QuantizationVocal Bursts Intensity Prediction	—Unverified
Discrete Audio Tokens: More Than a Survey!	Jun 12, 2025	Language ModelingLanguage Modelling	—Unverified
STBLLM: Breaking the 1-Bit Barrier with Structured Binary LLMs	Aug 3, 2024	BinarizationComputational Efficiency	—Unverified
Efficient Inference via Universal LSH Kernel	Jun 21, 2021	Knowledge DistillationQuantization	—Unverified
Efficient Implicit Neural Compression of Point Clouds via Learnable Activation in Latent Space	Apr 20, 2025	AttributeDecoder	—Unverified
Efficient Hybrid Network Architectures for Extremely Quantized Neural Networks Enabling Intelligence at the Edge	Feb 1, 2019	Edge-computingQuantization	—Unverified
A Novel Audio Representation for Music Genre Identification in MIR	Apr 1, 2024	Information RetrievalMusic Information Retrieval	—Unverified
Efficient Hardware Implementation of Incremental Learning and Inference on Chip	Nov 18, 2019	CPUIncremental Learning	—Unverified
Efficient Generative Modeling with Residual Vector Quantization-Based Tokens	Dec 13, 2024	Conditional Image GenerationImage Generation	—Unverified

Show:10 25 50

← PrevPage 95 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified