Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1001–1025 of 4925 papers

Title	Date	Tasks	Status	Score
Low Precision Decentralized Distributed Training over IID and non-IID Data	Nov 17, 2021	Quantization	CodeCode Available	5
LQ-Nets: Learned Quantization for Highly Accurate and Compact Deep Neural Networks	Jul 26, 2018	Quantization	CodeCode Available	5
Agile-Quant: Activation-Guided Quantization for Faster Inference of LLMs on the Edge	Dec 9, 2023	Language ModelingLanguage Modelling	CodeCode Available	5
Low-bit Quantization for Deep Graph Neural Networks with Smoothness-aware Message Propagation	Aug 29, 2023	Graph Neural NetworkNode Classification	CodeCode Available	5
Low-bit Model Quantization for Deep Neural Networks: A Survey	May 8, 2025	Quantization	CodeCode Available	5
Optimizing edge AI models on HPC systems with the edge in the loop	May 26, 2025	Hardware Aware Neural Architecture SearchKnowledge Distillation	CodeCode Available	5
Low-bit Quantization of Neural Networks for Efficient Inference	Feb 18, 2019	Quantization	CodeCode Available	5
PQA: Exploring the Potential of Product Quantization in DNN Hardware Acceleration	May 25, 2023	Quantization	CodeCode Available	5
LoTA-QAF: Lossless Ternary Adaptation for Quantization-Aware Fine-Tuning	May 24, 2025	Computational EfficiencyMMLU	CodeCode Available	5
Low-complexity acoustic scene classification for multi-device audio: analysis of DCASE 2021 Challenge systems	May 28, 2021	Acoustic Scene ClassificationQuantization	CodeCode Available	5
Loss Landscape Analysis for Reliable Quantized ML Models for Scientific Sensing	Feb 12, 2025	Quantization	CodeCode Available	5
ACCEPT: Adaptive Codebook for Composite and Efficient Prompt Tuning	Oct 10, 2024	Natural Language Understandingparameter-efficient fine-tuning	CodeCode Available	5
Loss-aware Weight Quantization of Deep Networks	Feb 23, 2018	BinarizationQuantization	CodeCode Available	5
Low dimensional representation of multi-patient flow cytometry datasets using optimal transport for minimal residual disease detection in leukemia	Jul 24, 2024	Dimensionality ReductionPrognosis	CodeCode Available	5
LRQ: Optimizing Post-Training Quantization for Large Language Models by Learning Low-Rank Weight-Scaling Matrices	Jul 16, 2024	Quantization	CodeCode Available	5
Log-Time K-Means Clustering for 1D Data: Novel Approaches with Proof and Implementation	Dec 19, 2024	ClusteringQuantization	CodeCode Available	5
A Resource-Efficient Embedded Iris Recognition System Using Fully Convolutional Networks	Sep 8, 2019	CPUGPU	CodeCode Available	5
LiteLMGuard: Seamless and Lightweight On-Device Prompt Filtering for Safeguarding Small Language Models against Quantization-induced Risks and Vulnerabilities	May 8, 2025	FairnessQuantization	CodeCode Available	5
LiteVAR: Compressing Visual Autoregressive Modelling with Efficient Attention and Quantization	Nov 26, 2024	Image GenerationQuantization	CodeCode Available	5
Lipschitz Continuity Retained Binary Neural Network	Jul 13, 2022	BinarizationQuantization	CodeCode Available	5
LISA: Learning Interpretable Skill Abstractions from Language	Feb 28, 2022	Decision MakingImitation Learning	CodeCode Available	5
Cross-Modal Epileptic Signal Harmonization: Frequency Domain Mapping Quantization for Pre-training a Unified Neurophysiological Transformer	Jun 20, 2025	EEGQuantization	CodeCode Available	5
Loss Aware Post-training Quantization	Nov 17, 2019	Quantization	CodeCode Available	5
Lightweight Client-Side Chinese/Japanese Morphological Analyzer Based on Online Learning	Aug 1, 2014	Domain AdaptationMorphological Analysis	CodeCode Available	5
Lightweight Deep Learning Based Channel Estimation for Extremely Large-Scale Massive MIMO Systems	Feb 14, 2024	Quantization	CodeCode Available	5

Show:10 25 50

← PrevPage 41 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified