Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4276–4300 of 4925 papers

Title	Date	Tasks	Status
DNA-TEQ: An Adaptive Exponential Quantization of Tensors for DNN Inference	Jun 28, 2023	Quantization	—Unverified
DNN Memory Footprint Reduction via Post-Training Intra-Layer Multi-Precision Quantization	Apr 3, 2024	Edge-computingQuantization	—Unverified
DNN Quantization with Attention	Mar 24, 2021	Object RecognitionQuantization	—Unverified
DNQ: Dynamic Network Quantization	Dec 6, 2018	Quantization	—Unverified
Do All MobileNets Quantize Poorly? Gaining Insights into the Effect of Quantization on Depthwise Separable Convolutional Networks Through the Eyes of Multi-scale Distributional Dynamics	Apr 24, 2021	AllQuantization	—Unverified
Does compressing activations help model parallel training?	Jan 6, 2023	modelQuantization	—Unverified
Does Video Compression Impact Tracking Accuracy?	Feb 2, 2022	Multiple Object TrackingObject	—Unverified
Domain Generalization on Efficient Acoustic Scene Classification using Residual Normalization	Nov 12, 2021	Acoustic Scene ClassificationClassification	—Unverified
Don't Fear the Bit Flips: Optimized Coding Strategies for Binary Classification	Mar 8, 2017	Binary ClassificationGeneral Classification	—Unverified
Don't Waste Your Bits! Squeeze Activations and Gradients for Deep Neural Networks via TinyScript	Jan 1, 2020	Quantization	—Unverified
DoTA: Weight-Decomposed Tensor Adaptation for Large Language Models	Dec 30, 2024	Arithmetic ReasoningQuantization	—Unverified
Double JPEG Detection in Mixed JPEG Quality Factors using Deep Convolutional Neural Network	Sep 1, 2018	Quantization	—Unverified
Double Quantization for Communication-Efficient Distributed Optimization	May 25, 2018	Distributed OptimizationQuantization	—Unverified
Double Viterbi: Weight Encoding for High Compression Ratio and Fast On-Chip Reconstruction for Deep Neural Network	May 1, 2019	Model CompressionQuantization	—Unverified
Downlink Clustering-Based Scheduling of IRS-Assisted Communications With Reconfiguration Constraints	May 23, 2023	ClusteringQuantization	—Unverified
Downlink MIMO Channel Estimation from Bits: Recoverability and Algorithm	Nov 25, 2024	Quantization	—Unverified
DP-Net: Dynamic Programming Guided Deep Neural Network Compression	Mar 21, 2020	ClusteringNeural Network Compression	—Unverified
On the Convergence of Differentially Private Federated Learning on Non-Lipschitz Objectives, and with Normalized Client Updates	Jun 13, 2021	BenchmarkingFederated Learning	—Unverified
DQA: An Efficient Method for Deep Quantization of Deep Neural Network Activations	Dec 12, 2024	image-classificationImage Classification	—Unverified
DQ-Data2vec: Decoupling Quantization for Multilingual Speech Recognition	Jan 23, 2025	QuantizationRepresentation Learning	—Unverified
DQ-SGD: Dynamic Quantization in SGD for Communication-Efficient Distributed Learning	Jul 30, 2021	Quantization	—Unverified
DQSGD: DYNAMIC QUANTIZED STOCHASTIC GRADIENT DESCENT FOR COMMUNICATION-EFFICIENT DISTRIBUTED LEARNING	Jan 1, 2021	Quantization	—Unverified
Dr. Splat: Directly Referring 3D Gaussian Splatting via Direct Language Embedding Registration	Feb 23, 2025	3DGS3D Semantic Segmentation	—Unverified
DSConv: Efficient Convolution Operator	Oct 1, 2019	Quantization	—Unverified
D-SVM over Networked Systems with Non-Ideal Linking Conditions	Apr 13, 2023	Binary ClassificationDistributed Optimization	—Unverified

Show:10 25 50

← PrevPage 172 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified