Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1151–1200 of 4925 papers

Title	Date	Tasks	Status
Communication-efficient Variance-reduced Stochastic Gradient Descent	Mar 10, 2020	Distributed OptimizationQuantization	—Unverified
Communication-Efficient Split Learning via Adaptive Feature-Wise Compression	Jul 20, 2023	Quantization	—Unverified
Communication Efficient SGD via Gradient Sampling With Bayes Prior	Jun 19, 2021	image-classificationImage Classification	—Unverified
AddNet: Deep Neural Networks Using FPGA-Optimized Multipliers	Nov 19, 2019	Quantization	—Unverified
Double Quantization for Communication-Efficient Distributed Optimization	May 25, 2018	Distributed OptimizationQuantization	—Unverified
Arbitrary Bit-width Network: A Joint Layer-Wise Quantization and Adaptive Inference Approach	Apr 21, 2022	Quantization	—Unverified
Communication-efficient k-Means for Edge-based Machine Learning	Feb 8, 2021	BIG-bench Machine LearningDimensionality Reduction	—Unverified
Acceleration for Compressed Gradient Descent in Distributed Optimization	Jan 1, 2020	Distributed OptimizationFederated Learning	—Unverified
Communication-Efficient Federated Learning by Quantized Variance Reduction for Heterogeneous Wireless Edge Networks	Jan 20, 2025	Federated LearningQuantization	—Unverified
Arabic Compact Language Modelling for Resource Limited Devices	Apr 1, 2021	Language ModelingLanguage Modelling	—Unverified
Additive Quantization for Extreme Vector Compression	Jun 1, 2014	General Classificationimage-classification	—Unverified
Double JPEG Detection in Mixed JPEG Quality Factors using Deep Convolutional Neural Network	Sep 1, 2018	Quantization	—Unverified
Double Viterbi: Weight Encoding for High Compression Ratio and Fast On-Chip Reconstruction for Deep Neural Network	May 1, 2019	Model CompressionQuantization	—Unverified
Communication-Efficient Federated Learning over Capacity-Limited Wireless Networks	Jul 20, 2023	Federated LearningQuantization	—Unverified
Communication-Efficient Federated Learning via Quantized Compressed Sensing	Nov 30, 2021	compressed sensingFederated Learning	—Unverified
AQUILA: Communication Efficient Federated Learning with Adaptive Quantization in Device Selection Strategy	Aug 1, 2023	Federated LearningPrivacy Preserving	—Unverified
Communication-Efficient Federated Learning via Optimal Client Sampling	Jul 30, 2020	Federated LearningLanguage Modeling	—Unverified
Communication Efficient Federated Learning over Multiple Access Channels	Jan 23, 2020	Federated LearningInformativeness	—Unverified
Quantum Block-Matching Algorithm using Dissimilarity Measure	Sep 27, 2023	ClusteringImage Clustering	—Unverified
3DMolNet: A Generative Network for Molecular Structures	Oct 8, 2020	QuantizationTranslation	—Unverified
Communication-Efficient Federated Distillation	Dec 1, 2020	Federated Learningimage-classification	—Unverified
Reducing Channel Estimation and Feedback Overhead in IRS-Aided Downlink System: A Quantize-then-Estimate Approach	Aug 4, 2023	Quantization	—Unverified
Don't Fear the Bit Flips: Optimized Coding Strategies for Binary Classification	Mar 8, 2017	Binary ClassificationGeneral Classification	—Unverified
Communication Efficient Distributed Learning with Censored, Quantized, and Generalized Group ADMM	Sep 14, 2020	Quantization	—Unverified
Accelerating RNN-based Speech Enhancement on a Multi-Core MCU with Mixed FP16-INT8 Post-Training Quantization	Oct 14, 2022	QuantizationSpeech Enhancement	—Unverified
Domain Generalization on Efficient Acoustic Scene Classification using Residual Normalization	Nov 12, 2021	Acoustic Scene ClassificationClassification	—Unverified
Don't Waste Your Bits! Squeeze Activations and Gradients for Deep Neural Networks via TinyScript	Jan 1, 2020	Quantization	—Unverified
DoTA: Weight-Decomposed Tensor Adaptation for Large Language Models	Dec 30, 2024	Arithmetic ReasoningQuantization	—Unverified
Downlink Clustering-Based Scheduling of IRS-Assisted Communications With Reconfiguration Constraints	May 23, 2023	ClusteringQuantization	—Unverified
Communication-Efficient Decentralized Multi-Agent Reinforcement Learning for Cooperative Adaptive Cruise Control	Aug 4, 2023	Autonomous VehiclesMulti-agent Reinforcement Learning	—Unverified
A Quantization-based Technique for Privacy Preserving Distributed Learning	Jun 26, 2024	Privacy PreservingQuantization	—Unverified
Communication Compression for Tensor Parallel LLM Inference	Nov 14, 2024	Quantization	—Unverified
A Quantitative Approach To The Temporal Dependency in Video Coding	Aug 26, 2021	Motion CompensationQuantization	—Unverified
AdderNet and its Minimalist Hardware Design for Energy-Efficient Artificial Intelligence	Jan 25, 2021	Quantization	—Unverified
3D Gaussian Splatting Data Compression with Mixture of Priors	May 6, 2025	3DGSData Compression	—Unverified
Communication and Energy Efficient Federated Learning using Zero-Order Optimization Technique	Sep 24, 2024	Federated LearningQuantization	—Unverified
COMET: Towards Partical W4A4KV4 LLMs Serving	Oct 16, 2024	QuantizationScheduling	—Unverified
A QP-adaptive Mechanism for CNN-based Filter in Video Coding	Oct 25, 2020	Quantization	—Unverified
Post Training Quantization of Large Language Models with Microscaling Formats	May 12, 2024	Language ModelingLanguage Modelling	—Unverified
Combining Compressions for Multiplicative Size Scaling on Natural Language Tasks	Aug 20, 2022	Knowledge DistillationNeural Network Compression	—Unverified
Accelerating Neural Network Inference by Overflow Aware Quantization	May 27, 2020	image-classificationImage Classification	—Unverified
Collaborative Quantization for Cross-Modal Similarity Search	Feb 2, 2019	Quantization	—Unverified
A Data and Compute Efficient Design for Limited-Resources Deep Learning	Apr 21, 2020	Deep LearningQuantization	—Unverified
Collaborative Quantization Embeddings for Intra-Subject Prostate MR Image Registration	Jul 13, 2022	Image RegistrationQuantization	—Unverified
Collaborative Multi-Teacher Knowledge Distillation for Learning Low Bit-width Deep Neural Networks	Oct 27, 2022	Knowledge DistillationQuantization	—Unverified
APTQ: Attention-aware Post-Training Mixed-Precision Quantization for Large Language Models	Feb 21, 2024	Quantization	—Unverified
Collaborative Filtering with Smooth Reconstruction of the Preference Function	Jan 1, 2021	Collaborative FilteringQuantization	—Unverified
Collaborative Edge AI Inference over Cloud-RAN	Apr 9, 2024	Quantization	—Unverified
AdaQAT: Adaptive Bit-Width Quantization-Aware Training	Apr 22, 2024	Quantization	—Unverified
Collaborative Automotive Radar Sensing via Mixed-Precision Distributed Array Completion	Mar 13, 2024	Matrix CompletionQuantization	—Unverified

Show:10 25 50

← PrevPage 24 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified