Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1601–1650 of 4925 papers

Title	Date	Tasks	Status
Countering Adversarial Examples: Combining Input Transformation and Noisy Training	Jun 25, 2021	Data AugmentationQuantization	—Unverified
Asynchronous Federated Learning with Bidirectional Quantized Communications and Buffered Aggregation	Aug 1, 2023	Federated LearningQuantization	—Unverified
Asymptotic Unbiased Sample Sampling to Speed Up Sharpness-Aware Minimization	Jun 12, 2024	Computational EfficiencyPose Estimation	—Unverified
Cost-Driven Hardware-Software Co-Optimization of Machine Learning Pipelines	Oct 11, 2023	Quantization	—Unverified
Cost-Aware Routing for Efficient Text-To-Image Generation	Jun 17, 2025	DenoisingImage Generation	—Unverified
Asymptotic tracking control of dynamic reference over homomorphically encrypted data with finite modulus	Sep 27, 2024	Quantization	—Unverified
AgileIR: Memory-Efficient Group Shifted Windows Attention for Agile Image Restoration	Sep 10, 2024	Image RestorationQuantization	—Unverified
A Channelized Binning Method for Extraction of Dominant Color Pixel Value	May 28, 2016	Quantization	—Unverified
CosSGD: Communication-Efficient Federated Learning with a Simple Cosine-Based Quantization	Dec 15, 2020	Federated Learningimage-classification	—Unverified
Correlation Hashing Network for Efficient Cross-Modal Retrieval	Feb 22, 2016	Cross-Modal RetrievalQuantization	—Unverified
Asymptotic stabilization under homomorphic encryption: A re-encryption free method	Apr 12, 2025	Quantization	—Unverified
Correlated Quantization for Faster Nonconvex Distributed Optimization	Jan 10, 2024	Distributed OptimizationQuantization	—Unverified
Correlated quantization for distributed mean estimation and optimization	Mar 9, 2022	Distributed OptimizationQuantization	—Unverified
Asymptotic Performance Analysis of Large-Scale Active IRS-Aided Wireless Network	May 31, 2023	Quantization	—Unverified
Aggressive Post-Training Compression on Extremely Large Language Models	Sep 30, 2024	Model CompressionNetwork Pruning	—Unverified
Coreset-Based Neural Network Compression	Jul 25, 2018	Neural Network CompressionQuantization	—Unverified
Asymptotic Analysis of One-bit Quantized Box-Constrained Precoding in Large-Scale Multi-User Systems	Feb 5, 2025	Quantization	—Unverified
CorBin-FL: A Differentially Private Federated Learning Mechanism using Common Randomness	Sep 20, 2024	Federated LearningQuantization	—Unverified
Coordinated Per-Antenna Power Minimization for Multicell Massive MIMO Systems with Low-Resolution Data Converters	Aug 8, 2022	Quantization	—Unverified
Asymptotically Optimal Closed-Form Phase Configuration of 1-bit RISs via Sign Alignment	Jul 18, 2024	FormQuantization	—Unverified
Aggregating empirical evidence from data strategy studies: a case on model quantization	May 1, 2025	GPUQuantization	—Unverified
Accurate Sine-Wave Amplitude Measurements Using Nonlinearly Quantized Data	Apr 28, 2018	Quantization	—Unverified
4-bit Quantization of LSTM-based Speech Recognition Models	Aug 27, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Inference Optimizations for Large Language Models: Effects, Challenges, and Practical Considerations	Aug 6, 2024	Knowledge DistillationNavigate	—Unverified
Asymmetric Learning Vector Quantization for Efficient Nearest Neighbor Classification in Dynamic Time Warping Spaces	Mar 24, 2017	ClassificationDynamic Time Warping	—Unverified
Convolutional Neural Networks Quantization with Attention	Sep 30, 2022	Quantization	—Unverified
Convolutional Neural Network Quantization using Generalized Gamma Distribution	Oct 31, 2018	Quantization	—Unverified
Asymmetric Learned Image Compression with Multi-Scale Residual Block, Importance Map, and Post-Quantization Filtering	Jun 21, 2022	DecoderImage Compression	—Unverified
Convolutional neural network compression for natural language processing	May 28, 2018	Neural Network CompressionQuantization	—Unverified
Asymmetric Deep Semantic Quantization for Image Retrieval	Mar 29, 2019	Image RetrievalQuantization	—Unverified
Convex Quantization Preserves Logconcavity	Jun 11, 2022	Quantization	—Unverified
Asymmetric Correlation Quantization Hashing for Cross-modal Retrieval	Jan 14, 2020	Cross-Modal RetrievalQuantization	—Unverified
Aggregated Learning: A Deep Learning Framework Based on Information-Bottleneck Vector Quantization	Jul 26, 2018	Image ClassificationQuantization	—Unverified
Convergence Theory of Generalized Distributed Subgradient Method with Random Quantization	Jul 22, 2022	Distributed OptimizationQuantization	—Unverified
AsymKV: Enabling 1-Bit Quantization of KV Cache with Layer-Wise Asymmetric Quantization Configurations	Oct 17, 2024	DecoderQuantization	—Unverified
Convergence Rates for Regularized Optimal Transport via Quantization	Aug 30, 2022	Quantization	—Unverified
Convergence rate of Tsallis entropic regularized optimal transport	Apr 13, 2023	Quantization	—Unverified
A Generalized Zero-Shot Quantization of Deep Convolutional Neural Networks via Learned Weights Statistics	Dec 6, 2021	Quantization	—Unverified
Convergence rate of sign stochastic gradient descent for non-convex functions	Jan 1, 2018	Distributed OptimizationQuantization	—Unverified
Convergence of Federated Learning over a Noisy Downlink	Aug 25, 2020	Federated LearningQuantization	—Unverified
A Survey on Transformer Compression	Feb 5, 2024	Knowledge DistillationMamba	—Unverified
Contrastive Quant: Quantization Makes Stronger Contrastive Learning	Sep 29, 2021	Contrastive LearningQuantization	—Unverified
CoST: Contrastive Quantization based Semantic Tokenization for Generative Recommendation	Apr 23, 2024	DecoderLanguage Modelling	—Unverified
A Survey on Model Compression for Large Language Models	Aug 15, 2023	BenchmarkingKnowledge Distillation	—Unverified
A General Family of Stochastic Proximal Gradient Methods for Deep Learning	Jul 15, 2020	Quantization	—Unverified
Accurate INT8 Training Through Dynamic Block-Level Fallback	Mar 11, 2025	Quantization	—Unverified
Contrastive Mutual Information Maximization for Binary Neural Networks	Sep 29, 2021	BinarizationContrastive Learning	—Unverified
A Survey on Methods and Theories of Quantized Neural Networks	Aug 13, 2018	Quantizationspeech-recognition	—Unverified
Continuous Speech Synthesis using per-token Latent Diffusion	Oct 21, 2024	Image GenerationQuantization	—Unverified
A Survey on Learning to Hash	Jun 1, 2016	QuantizationSurvey	—Unverified

Show:10 25 50

← PrevPage 33 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified