Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3501–3525 of 4925 papers

Title	Date	Tasks	Status
Zeroth-Order Fine-Tuning of LLMs with Extreme Sparsity	Jun 5, 2024	GPUQuantization	—Unverified
ZipML: Training Linear Models with End-to-End Low Precision, and a Little Bit of Deep Learning	Aug 1, 2017	Quantization	—Unverified
ZipVL: Efficient Large Vision-Language Models with Dynamic Token Sparsification	Oct 11, 2024	MMEQuantization	—Unverified
ZOBNN: Zero-Overhead Dependable Design of Binary Neural Networks with Deliberately Quantized Parameters	Jul 6, 2024	AttributeQuantization	—Unverified
1.58-bit FLUX	Dec 24, 2024	Computational EfficiencyImage Generation	—Unverified
MobiVSR: A Visual Speech Recognition Solution for Mobile Devices	May 10, 2019	Lip ReadingQuantization	—Unverified
Model Agnostic Hybrid Sharding For Heterogeneous Distributed Inference	Jul 29, 2024	Quantization	—Unverified
Model-Based Detector for SSDs in the Presence of Inter-cell Interference	Jan 31, 2019	DecoderQuantization	—Unverified
Model Compression	May 20, 2021	BIG-bench Machine Learningmodel	—Unverified
Model Compression and Efficient Inference for Large Language Models: A Survey	Feb 15, 2024	Knowledge DistillationModel Compression	—Unverified
Model compression as constrained optimization, with application to neural nets. Part II: quantization	Jul 13, 2017	BinarizationModel Compression	—Unverified
Model compression as constrained optimization, with application to neural nets. Part I: general framework	Jul 5, 2017	Model CompressionObject Recognition	—Unverified
Model compression as constrained optimization, with application to neural nets. Part V: combining compressions	Jul 9, 2021	Additive modelsLow-rank compression	—Unverified
Model Compression for DNN-based Speaker Verification Using Weight Quantization	Oct 31, 2022	Model CompressionQuantization	—Unverified
Model Compression Methods for YOLOv5: A Review	Jul 21, 2023	Knowledge Distillationmodel	—Unverified
Model Hemorrhage and the Robustness Limits of Large Language Models	Mar 31, 2025	Quantization	—Unverified
Modeling Image Quantization Tradeoffs for Optimal Compression	Dec 14, 2021	Quantization	—Unverified
Modeling Realistic Degradations in Non-blind Deconvolution	Jun 4, 2018	DeblurringImage Deblurring	—Unverified
Model Predictive Control for Neuromimetic Quantized Systems	Dec 19, 2022	modelModel Predictive Control	—Unverified
Model Selection CNN-based VVC QualityEnhancement	May 7, 2021	Decodermodel	—Unverified
Modular Transformers: Compressing Transformers into Modularized Layers for Flexible Efficient Inference	Jun 4, 2023	DecoderKnowledge Distillation	—Unverified
Modulation For Modulo: A Sampling-Efficient High-Dynamic Range ADC	Nov 22, 2023	Quantization	—Unverified
Modulo Sampling: Performance Guarantees in The Presence of Quantization	Jan 2, 2025	Quantization	—Unverified
MoGenTS: Motion Generation based on Spatial-Temporal Joint Modeling	Sep 26, 2024	Motion GenerationQuantization	—Unverified
Mokey: Enabling Narrow Fixed-Point Inference for Out-of-the-Box Floating-Point Transformer Models	Mar 23, 2022	Quantization	—Unverified

Show:10 25 50

← PrevPage 141 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified