Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4251–4300 of 4925 papers

Title	Date	Tasks	Status
Distributed Constraint-Coupled Optimization over Lossy Networks	Aug 30, 2022	Quantization	—Unverified
Distributed Convolutional Neural Network Training on Mobile and Edge Clusters	Sep 11, 2024	object-detectionObject Detection	—Unverified
Distributed CPU Scheduling Subject to Nonlinear Constraints	Aug 30, 2022	CPUDistributed Optimization	—Unverified
Distributed Deep Convolutional Compression for Massive MIMO CSI Feedback	Mar 7, 2020	Quantization	—Unverified
Distributed Deep Reinforcement Learning Based Gradient Quantization for Federated Learning Enabled Vehicle Edge Computing	Jul 11, 2024	Deep Reinforcement LearningEdge-computing	—Unverified
Distributed Delay-Tolerant Strategies for Equality-Constraint Sum-Preserving Resource Allocation	Oct 27, 2023	AllCPU	—Unverified
Distributed Energy Resource Management: All-Time Resource-Demand Feasibility, Delay-Tolerance, Nonlinearity, and Beyond	Aug 22, 2023	Allenergy management	—Unverified
Distributed Learning with Compressed Gradient Differences	Jan 26, 2019	Distributed ComputingQuantization	—Unverified
Distributed Learning with Sublinear Communication	Feb 28, 2019	Quantization	—Unverified
Distributed Mean Estimation with Limited Communication	Nov 2, 2016	Quantization	—Unverified
New Bounds For Distributed Mean Estimation and Variance Reduction	Feb 21, 2020	Distributed OptimizationQuantization	—Unverified
Distributed Optimization for Quadratic Cost Functions over Large-Scale Networks with Quantized Communication and Finite-Time Convergence	Apr 2, 2023	Distributed OptimizationFederated Learning	—Unverified
Distributed Optimization via Gradient Descent with Event-Triggered Zooming over Quantized Communication	Sep 8, 2023	Distributed OptimizationQuantization	—Unverified
Distributed Optimization with Efficient Communication, Event-Triggered Solution Enhancement, and Operation Stopping	Apr 23, 2025	Distributed OptimizationQuantization	—Unverified
Distributed Optimization with Finite Bit Adaptive Quantization for Efficient Communication and Precision Enhancement	Sep 9, 2024	Distributed OptimizationQuantization	—Unverified
Distribution Adaptive INT8 Quantization for Training CNNs	Feb 9, 2021	image-classificationImage Classification	—Unverified
Distribution-Aware Adaptive Multi-Bit Quantization	Jun 19, 2021	image-classificationImage Classification	—Unverified
Distribution-Preserving k-Anonymity	Nov 5, 2017	ClusteringQuantization	—Unverified
Distribution-sensitive Information Retention for Accurate Binary Neural Network	Sep 25, 2021	Binarizationimage-classification	—Unverified
Dithered backprop: A sparse and quantized backpropagation algorithm for more efficient deep neural network training	Apr 9, 2020	image-classificationImage Classification	—Unverified
Ditto: Accelerating Diffusion Model via Temporal Value Similarity	Jan 20, 2025	Image Generationmodel	—Unverified
Divergent Token Metrics: Measuring degradation to prune away LLM components -- and optimize quantization	Nov 2, 2023	ManagementModel Compression	—Unverified
DiverGet: A Search-Based Software Testing Approach for Deep Neural Network Quantization Assessment	Jul 13, 2022	AstronomyQuantization	—Unverified
Diversifying Sample Generation for Accurate Data-Free Quantization	Mar 1, 2021	Data Free Quantizationimage-classification	—Unverified
Divide and Conquer: Leveraging Intermediate Feature Representations for Quantized Training of Neural Networks	Jun 14, 2019	Knowledge DistillationQuantization	—Unverified
DNA-TEQ: An Adaptive Exponential Quantization of Tensors for DNN Inference	Jun 28, 2023	Quantization	—Unverified
DNN Memory Footprint Reduction via Post-Training Intra-Layer Multi-Precision Quantization	Apr 3, 2024	Edge-computingQuantization	—Unverified
DNN Quantization with Attention	Mar 24, 2021	Object RecognitionQuantization	—Unverified
DNQ: Dynamic Network Quantization	Dec 6, 2018	Quantization	—Unverified
Do All MobileNets Quantize Poorly? Gaining Insights into the Effect of Quantization on Depthwise Separable Convolutional Networks Through the Eyes of Multi-scale Distributional Dynamics	Apr 24, 2021	AllQuantization	—Unverified
Does compressing activations help model parallel training?	Jan 6, 2023	modelQuantization	—Unverified
Does Video Compression Impact Tracking Accuracy?	Feb 2, 2022	Multiple Object TrackingObject	—Unverified
Domain Generalization on Efficient Acoustic Scene Classification using Residual Normalization	Nov 12, 2021	Acoustic Scene ClassificationClassification	—Unverified
Don't Fear the Bit Flips: Optimized Coding Strategies for Binary Classification	Mar 8, 2017	Binary ClassificationGeneral Classification	—Unverified
Don't Waste Your Bits! Squeeze Activations and Gradients for Deep Neural Networks via TinyScript	Jan 1, 2020	Quantization	—Unverified
DoTA: Weight-Decomposed Tensor Adaptation for Large Language Models	Dec 30, 2024	Arithmetic ReasoningQuantization	—Unverified
Double JPEG Detection in Mixed JPEG Quality Factors using Deep Convolutional Neural Network	Sep 1, 2018	Quantization	—Unverified
Double Quantization for Communication-Efficient Distributed Optimization	May 25, 2018	Distributed OptimizationQuantization	—Unverified
Double Viterbi: Weight Encoding for High Compression Ratio and Fast On-Chip Reconstruction for Deep Neural Network	May 1, 2019	Model CompressionQuantization	—Unverified
Downlink Clustering-Based Scheduling of IRS-Assisted Communications With Reconfiguration Constraints	May 23, 2023	ClusteringQuantization	—Unverified
Downlink MIMO Channel Estimation from Bits: Recoverability and Algorithm	Nov 25, 2024	Quantization	—Unverified
DP-Net: Dynamic Programming Guided Deep Neural Network Compression	Mar 21, 2020	ClusteringNeural Network Compression	—Unverified
On the Convergence of Differentially Private Federated Learning on Non-Lipschitz Objectives, and with Normalized Client Updates	Jun 13, 2021	BenchmarkingFederated Learning	—Unverified
DQA: An Efficient Method for Deep Quantization of Deep Neural Network Activations	Dec 12, 2024	image-classificationImage Classification	—Unverified
DQ-Data2vec: Decoupling Quantization for Multilingual Speech Recognition	Jan 23, 2025	QuantizationRepresentation Learning	—Unverified
DQ-SGD: Dynamic Quantization in SGD for Communication-Efficient Distributed Learning	Jul 30, 2021	Quantization	—Unverified
DQSGD: DYNAMIC QUANTIZED STOCHASTIC GRADIENT DESCENT FOR COMMUNICATION-EFFICIENT DISTRIBUTED LEARNING	Jan 1, 2021	Quantization	—Unverified
Dr. Splat: Directly Referring 3D Gaussian Splatting via Direct Language Embedding Registration	Feb 23, 2025	3DGS3D Semantic Segmentation	—Unverified
DSConv: Efficient Convolution Operator	Oct 1, 2019	Quantization	—Unverified
D-SVM over Networked Systems with Non-Ideal Linking Conditions	Apr 13, 2023	Binary ClassificationDistributed Optimization	—Unverified

Show:10 25 50

← PrevPage 86 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified