Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 951–1000 of 4925 papers

Title	Date	Tasks	Status
A Survey of Quantization Methods for Efficient Neural Network Inference	Mar 25, 2021	Efficient Neural NetworkQuantization	—Unverified
Constrained Approximate Similarity Search on Proximity Graph	Oct 26, 2022	QuantizationRecommendation Systems	—Unverified
CoNLoCNN: Exploiting Correlation and Non-Uniform Quantization for Energy-Efficient Low-precision Deep Convolutional Neural Networks	Jul 31, 2022	Quantization	—Unverified
A Survey of Model Compression and Acceleration for Deep Neural Networks	Oct 23, 2017	BenchmarkingKnowledge Distillation	—Unverified
A flexible, extensible software framework for model compression based on the LC algorithm	May 15, 2020	BIG-bench Machine LearningLow-rank compression	—Unverified
A Survey of Methods for Low-Power Deep Learning and Computer Vision	Mar 24, 2020	Knowledge DistillationQuantization	—Unverified
Accurate Compression of Text-to-Image Diffusion Models via Vector Quantization	Aug 31, 2024	Image GenerationQuantization	—Unverified
Constructing High-Order Signed Distance Maps from Computed Tomography Data with Application to Bone Morphometry	Nov 2, 2021	Quantization	—Unverified
Conditionally Deep Hybrid Neural Networks Across Edge and Cloud	May 21, 2020	ClassificationCloud Computing	—Unverified
A Survey of Low-bit Large Language Models: Basics, Systems, and Algorithms	Sep 25, 2024	Quantization	—Unverified
DeepCABAC: Context-adaptive binary arithmetic coding for deep neural network compression	May 15, 2019	Neural Network CompressionQuantization	—Unverified
Contextual Compression Encoding for Large Language Models: A Novel Framework for Multi-Layered Parameter Space Pruning	Feb 12, 2025	Computational EfficiencyQuantization	—Unverified
A Survey on Deep Hashing Methods	Mar 4, 2020	Deep HashingDomain Adaptation	—Unverified
A Formalization of Image Vectorization by Region Merging	Sep 24, 2024	Image SegmentationQuantization	—Unverified
Continual Learning of Generative Models with Limited Data: From Wasserstein-1 Barycenter to Adaptive Coalescence	Jan 22, 2021	Continual LearningQuantization	—Unverified
Deep Learning for Radio Resource Allocation with Diverse Quality-of-Service Requirements in 5G	Mar 29, 2020	QuantizationTransfer Learning	—Unverified
Conditional Distribution Quantization in Machine Learning	Feb 11, 2025	QuantizationUncertainty Quantification	—Unverified
A Study on Unsupervised Dictionary Learning and Feature Encoding for Action Classification	Sep 2, 2013	Action ClassificationDictionary Learning	—Unverified
A study on speech enhancement using exponent-only floating point quantized neural network (EOFP-QNN)	Aug 17, 2018	Quantizationregression	—Unverified
Continuous Control with Action Quantization from Demonstrations	Oct 19, 2021	continuous-controlContinuous Control	—Unverified
Continuous Speech Synthesis using per-token Latent Diffusion	Oct 21, 2024	Image GenerationQuantization	—Unverified
A Survey on Learning to Hash	Jun 1, 2016	QuantizationSurvey	—Unverified
A Federated Reinforcement Learning Method with Quantization for Cooperative Edge Caching in Fog Radio Access Networks	Jun 23, 2022	Deep Reinforcement LearningQuantization	—Unverified
Contrastive Mutual Information Maximization for Binary Neural Networks	Sep 29, 2021	BinarizationContrastive Learning	—Unverified
CoST: Contrastive Quantization based Semantic Tokenization for Generative Recommendation	Apr 23, 2024	DecoderLanguage Modelling	—Unverified
Contrastive Quant: Quantization Makes Stronger Contrastive Learning	Sep 29, 2021	Contrastive LearningQuantization	—Unverified
Convergence of Federated Learning over a Noisy Downlink	Aug 25, 2020	Federated LearningQuantization	—Unverified
Convergence rate of sign stochastic gradient descent for non-convex functions	Jan 1, 2018	Distributed OptimizationQuantization	—Unverified
Computing with Hypervectors for Efficient Speaker Identification	Aug 28, 2022	CPUQuantization	—Unverified
Convergence Rates for Regularized Optimal Transport via Quantization	Aug 30, 2022	Quantization	—Unverified
Convergence Theory of Generalized Distributed Subgradient Method with Random Quantization	Jul 22, 2022	Distributed OptimizationQuantization	—Unverified
AsymKV: Enabling 1-Bit Quantization of KV Cache with Layer-Wise Asymmetric Quantization Configurations	Oct 17, 2024	DecoderQuantization	—Unverified
Compute-Optimal LLMs Provably Generalize Better With Scale	Apr 21, 2025	Generalization BoundsQuantization	—Unverified
How Does Batch Normalization Help Binary Training?	Sep 18, 2019	Quantization	—Unverified
Computation-Efficient Quantization Method for Deep Neural Networks	Sep 27, 2018	Quantization	—Unverified
Convolutional neural network compression for natural language processing	May 28, 2018	Neural Network CompressionQuantization	—Unverified
Convolutional Neural Network Quantization using Generalized Gamma Distribution	Oct 31, 2018	Quantization	—Unverified
Convolutional Neural Networks Quantization with Attention	Sep 30, 2022	Quantization	—Unverified
Asymmetric Learning Vector Quantization for Efficient Nearest Neighbor Classification in Dynamic Time Warping Spaces	Mar 24, 2017	ClassificationDynamic Time Warping	—Unverified
Aggregated Learning: A Deep Learning Framework Based on Information-Bottleneck Vector Quantization	Jul 26, 2018	Image ClassificationQuantization	—Unverified
Coordinated Per-Antenna Power Minimization for Multicell Massive MIMO Systems with Low-Resolution Data Converters	Aug 8, 2022	Quantization	—Unverified
CorBin-FL: A Differentially Private Federated Learning Mechanism using Common Randomness	Sep 20, 2024	Federated LearningQuantization	—Unverified
Coreset-Based Neural Network Compression	Jul 25, 2018	Neural Network CompressionQuantization	—Unverified
Asymptotic Analysis of One-bit Quantized Box-Constrained Precoding in Large-Scale Multi-User Systems	Feb 5, 2025	Quantization	—Unverified
Correlated quantization for distributed mean estimation and optimization	Mar 9, 2022	Distributed OptimizationQuantization	—Unverified
Correlated Quantization for Faster Nonconvex Distributed Optimization	Jan 10, 2024	Distributed OptimizationQuantization	—Unverified
Correlation Hashing Network for Efficient Cross-Modal Retrieval	Feb 22, 2016	Cross-Modal RetrievalQuantization	—Unverified
CosSGD: Communication-Efficient Federated Learning with a Simple Cosine-Based Quantization	Dec 15, 2020	Federated Learningimage-classification	—Unverified
Cost-Aware Routing for Efficient Text-To-Image Generation	Jun 17, 2025	DenoisingImage Generation	—Unverified
A Structurally Regularized Convolutional Neural Network for Image Classification using Wavelet-based SubBand Decomposition	Mar 2, 2021	ClassificationGeneral Classification	—Unverified

Show:10 25 50

← PrevPage 20 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified