Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 876–900 of 4925 papers

Title	Date	Tasks	Status	Hype	Score
Learning Statistical Texture for Semantic Segmentation	Mar 6, 2021	QuantizationSegmentation	CodeCode Available	1	5
Learning to Groove with Inverse Sequence Transformations	May 14, 2019	Generative Adversarial NetworkQuantization	CodeCode Available	1	5
Learning to Improve Image Compression without Changing the Standard Decoder	Sep 27, 2020	DecoderImage Compression	CodeCode Available	1	5
CondiQuant: Condition Number Based Low-Bit Quantization for Image Super-Resolution	Feb 21, 2025	Image Super-ResolutionQuantization	CodeCode Available	1	5
L-GreCo: Layerwise-Adaptive Gradient Compression for Efficient and Accurate Deep Learning	Oct 31, 2022	image-classificationImage Classification	CodeCode Available	1	5
Compressing LLMs: The Truth is Rarely Pure and Never Simple	Oct 2, 2023	QuantizationRetrieval	CodeCode Available	1	5
Lexico: Extreme KV Cache Compression via Sparse Coding over Universal Dictionaries	Dec 12, 2024	4kGSM8K	CodeCode Available	1	5
Conditional Coding and Variable Bitrate for Practical Learned Video Coding	Apr 19, 2021	DecoderQuantization	CodeCode Available	1	5
ConveRT: Efficient and Accurate Conversational Representations from Transformers	Nov 9, 2019	Conversational Response Selectionintent-classification	CodeCode Available	1	5
NAPA-VQ: Neighborhood Aware Prototype Augmentation with Vector Quantization for Continual Learning	Aug 18, 2023	class-incremental learningClass Incremental Learning	CodeCode Available	1	5
Training Multi-bit Quantized and Binarized Networks with A Learnable Symmetric Quantizer	Apr 1, 2021	BinarizationQuantization	CodeCode Available	1	5
NIPQ: Noise proxy-based Integrated Pseudo-Quantization	Jun 2, 2022	Quantization	CodeCode Available	1	5
Transferable Sparse Adversarial Attack	May 31, 2021	Adversarial AttackQuantization	CodeCode Available	1	5
Lightweight Super-Resolution Head for Human Pose Estimation	Jul 31, 2023	Pose EstimationQuantization	CodeCode Available	1	5
Self-Adapting Large Visual-Language Models to Edge Devices across Visual Modalities	Mar 7, 2024	Contrastive LearningKnowledge Distillation	CodeCode Available	1	5
Model-Aware Deep Architectures for One-Bit Compressive Variational Autoencoding	Nov 27, 2019	Compressive SensingQuantization	CodeCode Available	0	5
Model Compression Techniques in Biometrics Applications: A Survey	Jan 18, 2024	FairnessKnowledge Distillation	CodeCode Available	0	5
Mixed-TD: Efficient Neural Network Accelerator with Layer-Specific Tensor Decomposition	Jun 8, 2023	Efficient Neural NetworkQuantization	CodeCode Available	0	5
A Tale of Two Models: Constructing Evasive Attacks on Edge Models	Apr 22, 2022	QuantizationVocal Bursts Valence Prediction	CodeCode Available	0	5
Mixed-Precision Quantization for Deep Vision Models with Integer Quadratic Programming	Jul 11, 2023	QuantizationSensitivity	CodeCode Available	0	5
Model compression via distillation and quantization	Feb 15, 2018	image-classificationmodel	CodeCode Available	0	5
Mixed Non-linear Quantization for Vision Transformers	Jul 26, 2024	Quantization	CodeCode Available	0	5
Agile-Quant: Activation-Guided Quantization for Faster Inference of LLMs on the Edge	Dec 9, 2023	Language ModelingLanguage Modelling	CodeCode Available	0	5
Mitigating Quantization Errors Due to Activation Spikes in GLU-Based LLMs	May 23, 2024	Quantization	CodeCode Available	0	5
Mitigating the Impact of Outlier Channels for Language Model Quantization with Activation Regularization	Apr 4, 2024	GPULanguage Modeling	CodeCode Available	0	5

Show:10 25 50

← PrevPage 36 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified