Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4726–4750 of 4925 papers

Title	Date	Tasks	Status
ImPart: Importance-Aware Delta-Sparsification for Improved Model Compression and Merging in LLMs	Apr 17, 2025	Model CompressionQuantization	CodeCode Available
Web-Scale Image Clustering Revisited	Dec 1, 2015	ClusteringImage Clustering	CodeCode Available
Efficient course recommendations with T5-based ranking and summarization	Jun 27, 2024	In-Context LearningQuantization	CodeCode Available
Image Hashing by Minimizing Discrete Component-wise Wasserstein Distance	Feb 29, 2020	Image RetrievalQuantization	CodeCode Available
Post-training 4-bit quantization of convolution networks for rapid-deployment	Oct 2, 2018	Quantization	CodeCode Available
Post training 4-bit quantization of convolutional networks for rapid-deployment	Dec 1, 2019	Quantization	CodeCode Available
A Resource-Efficient Embedded Iris Recognition System Using Fully Convolutional Networks	Sep 8, 2019	CPUGPU	CodeCode Available
Post-training Model Quantization Using GANs for Synthetic Data Generation	May 10, 2023	QuantizationSynthetic Data Generation	CodeCode Available
VecQ: Minimal Loss DNN Model Compression With Vectorized Weight Quantization	May 18, 2020	Model Compressionobject-detection	CodeCode Available
Post-Training Quantization for 3D Medical Image Segmentation: A Practical Study on Real Inference Engines	Jan 28, 2025	Image SegmentationMedical Image Segmentation	CodeCode Available
Causal-DFQ: Causality Guided Data-free Network Quantization	Sep 24, 2023	Data Free QuantizationNeural Network Compression	CodeCode Available
REMIND Your Neural Network to Prevent Catastrophic Forgetting	Oct 6, 2019	QuantizationQuestion Answering	CodeCode Available
Remote Inference over Dynamic Links via Adaptive Rate Deep Task-Oriented Vector Quantization	Jan 5, 2025	Data CompressionQuantization	CodeCode Available
Identifying and Clustering Counter Relationships of Team Compositions in PvP Games for Efficient Balance Analysis	Aug 30, 2024	Card GamesGame Design	CodeCode Available
Efficient computation of counterfactual explanations of LVQ models	Aug 2, 2019	BIG-bench Machine Learningcounterfactual	CodeCode Available
Post-Training Quantization for Re-parameterization via Coarse & Fine Weight Splitting	Dec 17, 2023	Quantization	CodeCode Available
RepBNN: towards a precise Binary Neural Network with Enhanced Feature Map via Repeating	Jul 19, 2022	BinarizationQuantization	CodeCode Available
Efficient CNN-LSTM based Image Captioning using Neural Network Compression	Dec 17, 2020	DecoderImage Captioning	CodeCode Available
DAQ: Density-Aware Post-Training Weight-Only Quantization For LLMs	Oct 16, 2024	Quantization	CodeCode Available
A Quantization-Friendly Separable Convolution for MobileNets	Mar 22, 2018	Edge-computingGPU	CodeCode Available
IBVC: Interpolation-driven B-frame Video Compression	Sep 25, 2023	DecoderMotion Compensation	CodeCode Available
Focused Quantization for Sparse CNNs	Mar 7, 2019	Model CompressionNeural Network Compression	CodeCode Available
CUCL: Codebook for Unsupervised Continual Learning	Nov 25, 2023	Continual LearningDiversity	CodeCode Available
Post-training Quantization for Text-to-Image Diffusion Models with Progressive Calibration and Activation Relaxing	Nov 10, 2023	Quantization	CodeCode Available
Hyper-Sphere Quantization: Communication-Efficient SGD for Federated Learning	Nov 12, 2019	Federated LearningQuantization	CodeCode Available

Show:10 25 50

← PrevPage 190 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified