Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 626–650 of 4925 papers

Title	Date	Tasks	Status	Hype	Score
Accurate KV Cache Quantization with Outlier Tokens Tracing	May 16, 2025	Quantization	CodeCode Available	1	5
Conditional Coding and Variable Bitrate for Practical Learned Video Coding	Apr 19, 2021	DecoderQuantization	CodeCode Available	1	5
Lossy Image Compression with Quantized Hierarchical VAEs	Aug 27, 2022	Image CompressionQuantization	CodeCode Available	1	5
CondiQuant: Condition Number Based Low-Bit Quantization for Image Super-Resolution	Feb 21, 2025	Image Super-ResolutionQuantization	CodeCode Available	1	5
Bi3D: Stereo Depth Estimation via Binary Classifications	May 14, 2020	Autonomous NavigationDepth Estimation	CodeCode Available	1	5
A Benchmark for Gaussian Splatting Compression and Quality Assessment Study	Jul 19, 2024	AttributeData Compression	CodeCode Available	1	5
BiDM: Pushing the Limit of Quantization for Diffusion Models	Dec 8, 2024	BinarizationImage Generation	CodeCode Available	1	5
DenseShift: Towards Accurate and Efficient Low-Bit Power-of-Two Quantization	Aug 20, 2022	QuantizationTransfer Learning	CodeCode Available	1	5
LQ-LoRA: Low-rank Plus Quantized Matrix Decomposition for Efficient Language Model Finetuning	Nov 20, 2023	GPULanguage Modeling	CodeCode Available	1	5
COMQ: A Backpropagation-Free Algorithm for Post-Training Quantization	Mar 11, 2024	Quantization	CodeCode Available	1	5
ZeroQuant-V2: Exploring Post-training Quantization in LLMs from Comprehensive Study to Low Rank Compensation	Mar 15, 2023	Quantization	CodeCode Available	1	5
Compression with Bayesian Implicit Neural Representations	May 30, 2023	Audio CompressionQuantization	CodeCode Available	1	5
DGQ: Distribution-Aware Group Quantization for Text-to-Image Diffusion Models	Jan 8, 2025	Quantization	CodeCode Available	1	5
LaCo: Large Language Model Pruning via Layer Collapse	Feb 17, 2024	Knowledge DistillationLanguage Modeling	CodeCode Available	1	5
Differentiable JPEG: The Devil is in the Details	Sep 13, 2023	Adversarial AttackQuantization	CodeCode Available	1	5
Learning Architectures for Binary Networks	Feb 17, 2020	Quantization	CodeCode Available	1	5
L-GreCo: Layerwise-Adaptive Gradient Compression for Efficient and Accurate Deep Learning	Oct 31, 2022	image-classificationImage Classification	CodeCode Available	1	5
Jumping through Local Minima: Quantization in the Loss Landscape of Vision Transformers	Aug 21, 2023	Quantization	CodeCode Available	1	5
BinaryHPE: 3D Human Pose and Shape Estimation via Binarization	Nov 24, 2023	3D human pose and shape estimationBinarization	CodeCode Available	1	5
JointSQ: Joint Sparsification-Quantization for Distributed Learning	Jan 1, 2024	Quantization	CodeCode Available	1	5
Pruning Small Pre-Trained Weights Irreversibly and Monotonically Impairs "Difficult" Downstream Tasks in LLMs	Sep 29, 2023	Quantization	CodeCode Available	1	5
Compress Any Segment Anything Model (SAM)	Jul 11, 2025	modelQuantization	CodeCode Available	1	5
Joint Privacy Enhancement and Quantization in Federated Learning	Aug 23, 2022	Federated LearningPrivacy Preserving	CodeCode Available	1	5
An Automatic Graph Construction Framework based on Large Language Models for Recommendation	Dec 24, 2024	graph constructionQuantization	CodeCode Available	1	5
kANNolo: Sweet and Smooth Approximate k-Nearest Neighbors Search	Jan 10, 2025	Information RetrievalQuantization	CodeCode Available	1	5

Show:10 25 50

← PrevPage 26 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified