Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3951–4000 of 4925 papers

Title	Date	Tasks	Status
Communication-Efficient Federated Learning over Capacity-Limited Wireless Networks	Jul 20, 2023	Federated LearningQuantization	—Unverified
Communication-Efficient Federated Learning by Quantized Variance Reduction for Heterogeneous Wireless Edge Networks	Jan 20, 2025	Federated LearningQuantization	—Unverified
Communication-efficient k-Means for Edge-based Machine Learning	Feb 8, 2021	BIG-bench Machine LearningDimensionality Reduction	—Unverified
Communication Efficient SGD via Gradient Sampling With Bayes Prior	Jun 19, 2021	image-classificationImage Classification	—Unverified
Communication-Efficient Split Learning via Adaptive Feature-Wise Compression	Jul 20, 2023	Quantization	—Unverified
Communication-efficient Variance-reduced Stochastic Gradient Descent	Mar 10, 2020	Distributed OptimizationQuantization	—Unverified
Compact and Robust Deep Learning Architecture for Fluorescence Lifetime Imaging and FPGA Implementation	Sep 7, 2022	Quantization	—Unverified
CompactifAI: Extreme Compression of Large Language Models using Quantum-Inspired Tensor Networks	Jan 25, 2024	Model CompressionQuantization	—Unverified
Compact Neural Graphics Primitives with Learned Hash Probing	Dec 28, 2023	Quantization	—Unverified
Compact recurrent neural networks for acoustic event detection on low-energy low-complexity platforms	Jan 29, 2020	Event DetectionQuantization	—Unverified
Compact Representation for Image Classification: To Choose or to Compress?	Jun 1, 2014	ClassificationCPU	—Unverified
Compact Token Representations with Contextual Quantization for Efficient Document Re-ranking	Nov 16, 2021	QuantizationRe-Ranking	—Unverified
Compact Token Representations with Contextual Quantization for Efficient Document Re-ranking	Mar 29, 2022	QuantizationRe-Ranking	—Unverified
Comparing Fisher Information Regularization with Distillation for DNN Quantization	Oct 19, 2020	Knowledge DistillationQuantization	—Unverified
Comparing Iterative and Least-Squares Based Phase Noise Tracking in Receivers with 1-bit Quantization and Oversampling	Sep 12, 2023	Quantization	—Unverified
Comparison of 14 different families of classification algorithms on 115 binary datasets	Jun 2, 2016	General ClassificationQuantization	—Unverified
Compensate Quantization Errors: Make Weights Hierarchical to Compensate Each Other	Jun 24, 2024	Quantization	—Unverified
Compensate Quantization Errors+: Quantized Models Are Inquisitive Learners	Jul 22, 2024	Lightweight DeploymentQuantization	—Unverified
Completion Time Minimization of Fog-RAN-Assisted Federated Learning With Rate-Splitting Transmission	Jun 3, 2022	Federated LearningQuantization	—Unverified
CompMarkGS: Robust Watermarking for Compressed 3D Gaussian Splatting	Mar 17, 2025	3DGS3D Reconstruction	—Unverified
Component Training of Turbo Autoencoders	May 16, 2023	Quantization	—Unverified
Composite Code Sparse Autoencoders for first stage retrieval	Apr 14, 2022	Image RetrievalInformation Retrieval	—Unverified
Composite Correlation Quantization for Efficient Multimodal Retrieval	May 22, 2016	Cross-Modal RetrievalQuantization	—Unverified
Comprehensive Study on Performance Evaluation and Optimization of Model Compression: Bridging Traditional Deep Learning and Large Language Models	Jul 22, 2024	Deep Learningimage-classification	—Unverified
Comprehensive Survey of Model Compression and Speed up for Vision Transformers	Apr 16, 2024	Computational EfficiencyEdge-computing	—Unverified
Compressed Domain Prior-Guided Video Super-Resolution for Cloud Gaming Content	Jan 3, 2025	QuantizationSuper-Resolution	—Unverified
Compressed Models Decompress Race Biases: What Quantized Models Forget for Fair Face Recognition	Aug 23, 2023	Face RecognitionQuantization	—Unverified
Compressed Particle-Based Federated Bayesian Learning and Unlearning	Sep 14, 2022	Quantization	—Unverified
Compressed-VFL: Communication-Efficient Learning with Vertically Partitioned Data	Jun 16, 2022	Federated LearningQuantization	—Unverified
Compressed Video Super-Resolution based on Hierarchical Encoding	Jun 17, 2025	QuantizationSuper-Resolution	—Unverified
Compressing Deep Convolutional Networks using Vector Quantization	Dec 18, 2014	ClassificationClustering	—Unverified
Compressing Language Models for Specialized Domains	Feb 25, 2025	Quantization	—Unverified
Compressing Low Precision Deep Neural Networks Using Sparsity-Induced Regularization in Ternary Networks	Sep 19, 2017	L2 RegularizationModel Compression	—Unverified
Compressing Neural Machine Translation Models with 4-bit Precision	Jul 1, 2020	Machine TranslationNMT	—Unverified
Compressing Pre-trained Transformers via Low-Bit NxM Sparsity for Natural Language Understanding	Jun 30, 2022	Natural Language UnderstandingQuantization	—Unverified
Compressing Recurrent Neural Networks for FPGA-accelerated Implementation in Fluorescence Lifetime Imaging	Oct 1, 2024	Computational EfficiencyKnowledge Distillation	—Unverified
Compressing Unknown Images With Product Quantizer for Efficient Zero-Shot Classification	Jun 1, 2019	General ClassificationGeneralized Zero-Shot Learning	—Unverified
Compressing VAE-Based Out-of-Distribution Detectors for Embedded Deployment	Sep 2, 2024	CPUGPU	—Unverified
Compressing Weight-updates for Image Artifacts Removal Neural Networks	May 10, 2019	DecoderImage Compression	—Unverified
Compression-based Privacy Preservation for Distributed Nash Equilibrium Seeking in Aggregative Games	May 6, 2024	Quantization	—Unverified
Compression for Better: A General and Stable Lossless Compression Framework	Dec 9, 2024	Computational EfficiencyModel Compression	—Unverified
Compression of Acoustic Event Detection Models with Low-rank Matrix Factorization and Quantization Training	May 2, 2019	Event DetectionQuantization	—Unverified
Compression of Acoustic Event Detection Models With Quantized Distillation	Jul 1, 2019	Event DetectionKnowledge Distillation	—Unverified
Compression of Deep Convolutional Neural Networks under Joint Sparsity Constraints	May 21, 2018	Quantization	—Unverified
Compression of Deep Learning Models for Text: A Survey	Aug 12, 2020	Deep LearningInformation Retrieval	—Unverified
Compression of Deep Neural Networks for Image Instance Retrieval	Jan 18, 2017	Image Instance RetrievalModel Compression	—Unverified
Compression of Deep Neural Networks on the Fly	Sep 29, 2015	Object RecognitionQuantization	—Unverified
Compression of Generative Pre-trained Language Models via Quantization	Mar 21, 2022	Model CompressionQuantization	—Unverified
Compression of Recurrent Neural Networks for Efficient Language Modeling	Feb 6, 2019	Language ModelingLanguage Modelling	—Unverified
Compression of Site-Specific Deep Neural Networks for Massive MIMO Precoding	Feb 12, 2025	Neural Architecture SearchNeural Network Compression	—Unverified

Show:10 25 50

← PrevPage 80 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified