Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4376–4400 of 4925 papers

Title	Date	Tasks	Status
Efficient Hybrid Network Architectures for Extremely Quantized Neural Networks Enabling Intelligence at the Edge	Feb 1, 2019	Edge-computingQuantization	—Unverified
Efficient Implicit Neural Compression of Point Clouds via Learnable Activation in Latent Space	Apr 20, 2025	AttributeDecoder	—Unverified
Efficient Inference via Universal LSH Kernel	Jun 21, 2021	Knowledge DistillationQuantization	—Unverified
Efficient Inferencing of Compressed Deep Neural Networks	Nov 1, 2017	Quantization	—Unverified
Efficient Large-Scale Approximate Nearest Neighbor Search on OpenCL FPGA	Jun 1, 2018	CPUGPU	—Unverified
Efficient Learned Lossless JPEG Recompression	Aug 25, 2023	GPUImage Compression	—Unverified
EfficientLLM: Efficiency in Large Language Models	May 20, 2025	Mixture-of-ExpertsQuantization	—Unverified
Efficiently Scaling Transformer Inference	Nov 9, 2022	Quantization	—Unverified
Efficient Machine Translation with Model Pruning and Quantization	Nov 1, 2021	CPUDecoder	—Unverified
Efficient Match Kernel between Sets of Features for Visual Recognition	Dec 1, 2009	Quantization	—Unverified
Efficient multivariate sequence classification	Sep 29, 2014	ClassificationGeneral Classification	—Unverified
Efficient Neural Compression with Inference-time Decoding	Jun 10, 2024	DecoderQuantization	—Unverified
Efficient Neural Networks for Tiny Machine Learning: A Comprehensive Review	Nov 20, 2023	Model CompressionQuantization	—Unverified
Efficient Neural PDE-Solvers using Quantization Aware Training	Aug 14, 2023	Quantization	—Unverified
Efficient On-the-fly Category Retrieval using ConvNets and GPUs	Jul 17, 2014	BinarizationGPU	—Unverified
Efficient Point Transformer for Large-scale 3D Scene Understanding	Sep 29, 2021	3D Semantic SegmentationQuantization	—Unverified
Efficient Quantization Strategies for Latent Diffusion Models	Dec 9, 2023	Image GenerationQuantization	—Unverified
Efficient Quantum Approximate kNN Algorithm via Granular-Ball Computing	May 29, 2025	Quantization	—Unverified
Efficient Approximate Search for Sets of Vectors	Jul 14, 2021	Quantization	—Unverified
Efficient Speech Representation Learning with Low-Bit Quantization	Dec 14, 2022	Model CompressionQuantization	—Unverified
Efficient Storage of Fine-Tuned Models via Low-Rank Approximation of Weight Residuals	May 28, 2023	Quantization	—Unverified
Efficient Super Resolution Using Binarized Neural Network	Dec 16, 2018	Binarizationimage-classification	—Unverified
Efficient Systolic Array Based on Decomposable MAC for Quantized Deep Neural Networks	Jan 1, 2020	Quantization	—Unverified
Efficient Vision-based Vehicle Speed Estimation	May 2, 2025	Quantizationvehicle detection	—Unverified
Efficient-VQGAN: Towards High-Resolution Image Generation with Efficient Vision Transformers	Oct 9, 2023	Image GenerationImage Reconstruction	—Unverified

Show:10 25 50

← PrevPage 176 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified