Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4901–4925 of 4925 papers

Title	Date	Tasks	Status
GenQ: Quantization in Low Data Regimes with Generative Synthetic Data	Dec 7, 2023	Computational EfficiencyQuantization	CodeCode Available
QEBVerif: Quantization Error Bound Verification of Neural Networks	Dec 6, 2022	Quantization	CodeCode Available
QEFT: Quantization for Efficient Fine-Tuning of LLMs	Oct 11, 2024	parameter-efficient fine-tuningQuantization	CodeCode Available
Robust open-set classification for encrypted traffic fingerprinting	Aug 23, 2023	Classificationopen-set classification	CodeCode Available
Boosting CNN-based primary quantization matrix estimation of double JPEG images via a classification-like architecture	Dec 1, 2020	Image ForensicsQuantization	CodeCode Available
A Physics-Informed Vector Quantized Autoencoder for Data Compression of Turbulent Flow	Jan 10, 2022	Data CompressionQuantization	CodeCode Available
DNN Feature Map Compression using Learned Representation over GF(2)	Aug 15, 2018	Dimensionality ReductionGeneral Classification	CodeCode Available
Stacked Quantizers for Compositional Vector Compression	Nov 8, 2014	Quantization	CodeCode Available
Data Efficient Stagewise Knowledge Distillation	Nov 15, 2019	Knowledge DistillationModel Compression	CodeCode Available
Flexible framework for audio reconstruction	Jul 29, 2020	Audio inpaintingQuantization	CodeCode Available
BlockDialect: Block-wise Fine-grained Mixed Format Quantization for Energy-Efficient LLM Inference	Jan 2, 2025	Quantization	CodeCode Available
Exploration into Translation-Equivariant Image Quantization	Dec 1, 2021	Image GenerationImage to text	CodeCode Available
Word2Bits - Quantized Word Vectors	Mar 15, 2018	QuantizationQuestion Answering	CodeCode Available
Q-HyViT: Post-Training Quantization of Hybrid Vision Transformers with Bridge Block Reconstruction for IoT Systems	Mar 22, 2023	Quantization	CodeCode Available
FlashEval: Towards Fast and Accurate Evaluation of Text-to-image Diffusion Generative Models	Mar 25, 2024	Quantization	CodeCode Available
FINN-L: Library Extensions and Design Trade-off Analysis for Variable Precision LSTM Networks on FPGAs	Jul 11, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Find the Lady: Permutation and Re-Synchronization of Deep Neural Networks	Dec 19, 2023	Quantization	CodeCode Available
STAR: Learning Diverse Robot Skill Abstractions through Rotation-Augmented Vector Quantization	Jun 4, 2025	Action GenerationQuantization	CodeCode Available
Diversity in deep generative models and generative AI	Feb 19, 2022	BIG-bench Machine LearningDecoder	CodeCode Available
Divergence Frontiers for Generative Models: Sample Complexity, Quantization Effects, and Frontier Integrals	Jun 15, 2021	DiversityQuantization	CodeCode Available
QLESS: A Quantized Approach for Data Valuation and Selection in Large Language Model Fine-Tuning	Feb 3, 2025	Data ValuationLanguage Modeling	CodeCode Available
Distribution Agnostic Symbolic Representations for Time Series Dimensionality Reduction and Online Anomaly Detection	May 20, 2021	Anomaly DetectionClustering	CodeCode Available
Efficient Randomized Subspace Embeddings for Distributed Optimization under a Communication Budget	Mar 13, 2021	Distributed OptimizationQuantization	CodeCode Available
Finding Non-Uniform Quantization Schemes using Multi-Task Gaussian Processes	Jul 15, 2020	Gaussian ProcessesNeural Architecture Search	CodeCode Available
Filtering Empty Camera Trap Images in Embedded Systems	Apr 18, 2021	Image ClassificationQuantization	CodeCode Available

Show:10 25 50

← PrevPage 99 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified