Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2376–2400 of 4925 papers

Title	Date	Tasks	Status
Deep neural networks algorithms for stochastic control problems on finite horizon: convergence analysis	Dec 11, 2018	Deep Reinforcement LearningQuantization	—Unverified
Killing Two Birds with One Stone: Quantization Achieves Privacy in Distributed Learning	Apr 26, 2023	Quantization	—Unverified
Learning Kernel-Modulated Neural Representation for Efficient Light Field Compression	Jul 12, 2023	DescriptiveQuantization	—Unverified
K-Means Hashing: An Affinity-Preserving Quantization Method for Learning Binary Compact Codes	Jun 1, 2013	ClusteringQuantization	—Unverified
Knowledge Distillation: A Survey	Jun 9, 2020	Knowledge DistillationModel Compression	—Unverified
Knowledge Distillation in Vision Transformers: A Critical Review	Feb 4, 2023	Decoderimage-classification	—Unverified
Knowledge Transfer in Model-Based Reinforcement Learning Agents for Efficient Multi-Task Learning	Jan 9, 2025	Model-based Reinforcement LearningMulti-Task Learning	—Unverified
Learning Linear Block Codes with Gradient Quantization	Mar 20, 2025	DecoderQuantization	—Unverified
Designing a Classifier for Active Fire Detection from Multispectral Satellite Imagery Using Neural Architecture Search	Oct 7, 2024	Fire DetectionNeural Architecture Search	—Unverified
Kramers-Kronig Receiver Combined With Digital Resolution Enhancer	Jul 22, 2021	Quantization	—Unverified
KurTail : Kurtosis-based LLM Quantization	Mar 3, 2025	GPULanguage Modeling	—Unverified
Integer Scale: A Free Lunch for Faster Fine-grained Quantization of LLMs	May 23, 2024	Quantization	—Unverified
KV Cache is 1 Bit Per Channel: Efficient Large Language Model Inference with Coupled Quantization	May 7, 2024	GPULanguage Modeling	—Unverified
KVmix: Gradient-Based Layer Importance-Aware Mixed-Precision Quantization for KV Cache	May 18, 2025	Quantization	—Unverified
Deep neural networks algorithms for stochastic control problems on finite horizon: numerical applications	Dec 13, 2018	ManagementQuantization	—Unverified
Deep Neural Network Models Compression	Mar 4, 2021	Knowledge DistillationQuantization	—Unverified
L1-Norm Batch Normalization for Efficient Training of Deep Neural Networks	Feb 27, 2018	Computational EfficiencyQuantization	—Unverified
L4Q: Parameter Efficient Quantization-Aware Fine-Tuning on Large Language Models	Feb 7, 2024	Few-Shot LearningIn-Context Learning	—Unverified
Integer or Floating Point? New Outlooks for Low-Bit Quantization on Large Language Models	May 21, 2023	GPUQuantization	—Unverified
A Wave is Worth 100 Words: Investigating Cross-Domain Transferability in Time Series	Dec 1, 2024	ImputationQuantization	—Unverified
LAMBDA: Covering the Solution Set of Black-Box Inequality by Search Space Quantization	Mar 25, 2022	BenchmarkingQuantization	—Unverified
LANCE: Efficient Low-Precision Quantized Winograd Convolution for Neural Networks Based on Graphics Processing Units	Mar 19, 2020	image-classificationImage Classification	—Unverified
Design of Stochastic Quantizers for Privacy Preservation	Mar 5, 2024	Privacy PreservingQuantization	—Unverified
A Low Memory Footprint Quantized Neural Network for Depth Completion of Very Sparse Time-of-Flight Depth Maps	May 25, 2022	DecoderDepth Completion	—Unverified
Learning Sparse Low-Precision Neural Networks With Learnable Regularization	Sep 1, 2018	Image Super-ResolutionL2 Regularization	—Unverified

Show:10 25 50

← PrevPage 96 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified