Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1001–1050 of 4925 papers

Title	Date	Tasks	Status	Score
Comprehensive Comparisons of Uniform Quantization in Deep Image Compression	Mar 1, 2023	DecoderImage Compression	CodeCode Available	5
Comprehensive Analysis of the Object Detection Pipeline on UAVs	Mar 1, 2022	Camera Calibrationdistortion correction	CodeCode Available	5
Compositional Sketch Search	Jun 15, 2021	Image RetrievalPosition	CodeCode Available	5
Composite Quantization	Dec 4, 2017	Quantization	CodeCode Available	5
Are You Getting What You Pay For? Auditing Model Substitution in LLM APIs	Apr 7, 2025	BenchmarkingFairness	CodeCode Available	5
PQA: Exploring the Potential of Product Quantization in DNN Hardware Acceleration	May 25, 2023	Quantization	CodeCode Available	5
Make RepVGG Greater Again: A Quantization-aware Approach	Dec 3, 2022	QuantizationSemantic Segmentation	CodeCode Available	5
Machine Learning at the Wireless Edge: Distributed Stochastic Gradient Descent Over-the-Air	Jan 3, 2019	BIG-bench Machine LearningQuantization	CodeCode Available	5
Maestro: Uncovering Low-Rank Structures via Trainable Decomposition	Aug 28, 2023	Low-rank compressionQuantization	CodeCode Available	5
ACCEPT: Adaptive Codebook for Composite and Efficient Prompt Tuning	Oct 10, 2024	Natural Language Understandingparameter-efficient fine-tuning	CodeCode Available	5
Memory-Driven Mixed Low Precision Quantization For Enabling Deep Network Inference On Microcontrollers	May 30, 2019	Quantization	CodeCode Available	5
LRQ: Optimizing Post-Training Quantization for Large Language Models by Learning Low-Rank Weight-Scaling Matrices	Jul 16, 2024	Quantization	CodeCode Available	5
LQ-Nets: Learned Quantization for Highly Accurate and Compact Deep Neural Networks	Jul 26, 2018	Quantization	CodeCode Available	5
A Resource-Efficient Embedded Iris Recognition System Using Fully Convolutional Networks	Sep 8, 2019	CPUGPU	CodeCode Available	5
LSQ++: Lower running time and higher recall in multi-codebook quantization	Sep 1, 2018	Quantization	CodeCode Available	5
Low-Precision Stochastic Gradient Langevin Dynamics	Jun 20, 2022	Deep LearningQuantization	CodeCode Available	5
Low Precision Decentralized Distributed Training over IID and non-IID Data	Nov 17, 2021	Quantization	CodeCode Available	5
Picking Up Quantization Steps for Compressed Image Classification	Apr 21, 2023	Classificationimage-classification	CodeCode Available	5
Low-Precision Random Fourier Features for Memory-Constrained Kernel Approximation	Oct 31, 2018	Quantization	CodeCode Available	5
LVLM-Compress-Bench: Benchmarking the Broader Impact of Large Vision-Language Model Compression	Mar 6, 2025	BenchmarkingCommon Sense Reasoning	CodeCode Available	5
Low-bit Quantization for Deep Graph Neural Networks with Smoothness-aware Message Propagation	Aug 29, 2023	Graph Neural NetworkNode Classification	CodeCode Available	5
Low-bit Model Quantization for Deep Neural Networks: A Survey	May 8, 2025	Quantization	CodeCode Available	5
Low-bit Quantization of Neural Networks for Efficient Inference	Feb 18, 2019	Quantization	CodeCode Available	5
LoTA-QAF: Lossless Ternary Adaptation for Quantization-Aware Fine-Tuning	May 24, 2025	Computational EfficiencyMMLU	CodeCode Available	5
Low-complexity acoustic scene classification for multi-device audio: analysis of DCASE 2021 Challenge systems	May 28, 2021	Acoustic Scene ClassificationQuantization	CodeCode Available	5
Low dimensional representation of multi-patient flow cytometry datasets using optimal transport for minimal residual disease detection in leukemia	Jul 24, 2024	Dimensionality ReductionPrognosis	CodeCode Available	5
LVPNet: A Latent-variable-based Prediction-driven End-to-end Framework for Lossless Compression of Medical Images	Jun 22, 2025	Image CompressionImage Segmentation	CodeCode Available	5
Merge-Friendly Post-Training Quantization for Multi-Target Domain Adaptation	May 29, 2025	Domain AdaptationMulti-target Domain Adaptation	CodeCode Available	5
Communication Efficient Private Federated Learning Using Dithering	Sep 14, 2023	Federated LearningQuantization	CodeCode Available	5
Log-Time K-Means Clustering for 1D Data: Novel Approaches with Proof and Implementation	Dec 19, 2024	ClusteringQuantization	CodeCode Available	5
Loss Aware Post-training Quantization	Nov 17, 2019	Quantization	CodeCode Available	5
Communication-Efficient Multi-Device Inference Acceleration for Transformer Models	May 25, 2025	Quantization	CodeCode Available	5
Communication-Efficient Federated Learning via Predictive Coding	Aug 2, 2021	Data CompressionFederated Learning	CodeCode Available	5
Loss-aware Weight Quantization of Deep Networks	Feb 23, 2018	BinarizationQuantization	CodeCode Available	5
LiteVAR: Compressing Visual Autoregressive Modelling with Efficient Attention and Quantization	Nov 26, 2024	Image GenerationQuantization	CodeCode Available	5
Additive Powers-of-Two Quantization: An Efficient Non-uniform Discretization for Neural Networks	Sep 28, 2019	Computational EfficiencyQuantization	CodeCode Available	5
Additive Noise Annealing and Approximation Properties of Quantized Neural Networks	May 24, 2019	image-classificationImage Classification	CodeCode Available	5
Communication-Efficient Federated Linear and Deep Generalized Canonical Correlation Analysis	Sep 25, 2021	Distributed ComputingDistributed Optimization	CodeCode Available	5
LiteLMGuard: Seamless and Lightweight On-Device Prompt Filtering for Safeguarding Small Language Models against Quantization-induced Risks and Vulnerabilities	May 8, 2025	FairnessQuantization	CodeCode Available	5
A Quantization-Friendly Separable Convolution for MobileNets	Mar 22, 2018	Edge-computingGPU	CodeCode Available	5
Communication-Efficient Distributed Blockwise Momentum SGD with Error-Feedback	May 27, 2019	Quantization	CodeCode Available	5
LISA: Learning Interpretable Skill Abstractions from Language	Feb 28, 2022	Decision MakingImitation Learning	CodeCode Available	5
Loss Landscape Analysis for Reliable Quantized ML Models for Scientific Sensing	Feb 12, 2025	Quantization	CodeCode Available	5
Linearly Converging Error Compensated SGD	Oct 23, 2020	Quantization	CodeCode Available	5
Accelerating PoT Quantization on Edge Devices	Sep 30, 2024	CPUQuantization	CodeCode Available	5
Communication-Censored Distributed Stochastic Gradient Descent	Sep 9, 2019	QuantizationStochastic Optimization	CodeCode Available	5
Lightweight Client-Side Chinese/Japanese Morphological Analyzer Based on Online Learning	Aug 1, 2014	Domain AdaptationMorphological Analysis	CodeCode Available	5
Multimodal Unsupervised Domain Generalization by Retrieving Across the Modality Gap	Feb 6, 2024	Domain GeneralizationQuantization	CodeCode Available	5
Lightweight Deep Learning Based Channel Estimation for Extremely Large-Scale Massive MIMO Systems	Feb 14, 2024	Quantization	CodeCode Available	5
Light Multi-segment Activation for Model Compression	Jul 16, 2019	Knowledge Distillationmodel	CodeCode Available	5

Show:10 25 50

← PrevPage 21 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified