Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4426–4450 of 4925 papers

Title	Date	Tasks	Status
Normalization Helps Training of Quantized LSTM	Dec 1, 2019	Quantization	CodeCode Available
Norm-Explicit Quantization: Improving Vector Quantization for Maximum Inner Product Search	Nov 12, 2019	Data CompressionQuantization	CodeCode Available
Accelerating Error Correction Code Transformers	Oct 8, 2024	Quantization	CodeCode Available
Loss-aware Weight Quantization of Deep Networks	Feb 23, 2018	BinarizationQuantization	CodeCode Available
Winner-takes-all learners are geometry-aware conditional density estimators	Jun 7, 2024	AllDensity Estimation	CodeCode Available
Conditional COT-GAN for Video Prediction with Kernel Smoothing	Jun 10, 2021	PredictionQuantization	CodeCode Available
Loss Aware Post-training Quantization	Nov 17, 2019	Quantization	CodeCode Available
A Bag-of-Words Equivalent Recurrent Neural Network for Action Recognition	Mar 23, 2017	Action RecognitionGeneral Classification	CodeCode Available
BASQ: Branch-wise Activation-clipping Search Quantization for Sub-4-bit Neural Networks	Oct 23, 2022	Neural Architecture SearchQuantization	CodeCode Available
Log-Time K-Means Clustering for 1D Data: Novel Approaches with Proof and Implementation	Dec 19, 2024	ClusteringQuantization	CodeCode Available
Detection of extragalactic Ultra-Compact Dwarfs and Globular Clusters using Explainable AI techniques	Jan 5, 2022	Feature ImportanceQuantization	CodeCode Available
What Do Compressed Deep Neural Networks Forget?	Nov 13, 2019	FairnessInterpretability Techniques for Deep Learning	CodeCode Available
LiteVAR: Compressing Visual Autoregressive Modelling with Efficient Attention and Quantization	Nov 26, 2024	Image GenerationQuantization	CodeCode Available
NUQSGD: Improved Communication Efficiency for Data-parallel SGD via Nonuniform Quantization	Aug 16, 2019	Quantization	CodeCode Available
Multimodal Unsupervised Domain Generalization by Retrieving Across the Modality Gap	Feb 6, 2024	Domain GeneralizationQuantization	CodeCode Available
Towards Effective Low-bitwidth Convolutional Neural Networks	Nov 1, 2017	Quantization	CodeCode Available
LiteLMGuard: Seamless and Lightweight On-Device Prompt Filtering for Safeguarding Small Language Models against Quantization-induced Risks and Vulnerabilities	May 8, 2025	FairnessQuantization	CodeCode Available
Detecting Adversarial Image Examples in Deep Networks with Adaptive Noise Reduction	May 23, 2017	Quantization	CodeCode Available
Towards Efficient Active Learning of PDFA	Jun 17, 2022	Active LearningQuantization	CodeCode Available
Exploiting the Partly Scratch-off Lottery Ticket for Quantization-Aware Training	Nov 12, 2022	Quantization	CodeCode Available
Adaptive Prediction-Powered AutoEval with Reliability and Efficiency Guarantees	May 24, 2025	Quantization	CodeCode Available
Depthwise Discrete Representation Learning	Apr 11, 2020	QuantizationRepresentation Learning	CodeCode Available
LISA: Learning Interpretable Skill Abstractions from Language	Feb 28, 2022	Decision MakingImitation Learning	CodeCode Available
A2Q+: Improving Accumulator-Aware Weight Quantization	Jan 19, 2024	Quantization	CodeCode Available
Denoising Noisy Neural Networks: A Bayesian Approach with Compensation	May 22, 2021	DenoisingQuantization	CodeCode Available

Show:10 25 50

← PrevPage 178 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified