Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–625 of 4925 papers

Title	Date	Tasks	Status	Hype	Score
Confounding Tradeoffs for Neural Network Quantization	Feb 12, 2021	Quantization	CodeCode Available	1	5
Jointly Optimizing Query Encoder and Product Quantization to Improve Retrieval Performance	Aug 2, 2021	CPUGPU	CodeCode Available	1	5
A Memory Efficient Baseline for Open Domain Question Answering	Dec 30, 2020	Dimensionality ReductionOpen-Domain Question Answering	CodeCode Available	1	5
BAND-2k: Banding Artifact Noticeable Database for Banding Detection and Quality Assessment	Nov 29, 2023	2kImage Quality Assessment	CodeCode Available	1	5
Compression with Bayesian Implicit Neural Representations	May 30, 2023	Audio CompressionQuantization	CodeCode Available	1	5
CPLLM: Clinical Prediction with Large Language Models	Sep 20, 2023	Disease PredictionLanguage Modeling	CodeCode Available	1	5
Designing Large Foundation Models for Efficient Training and Inference: A Survey	Sep 3, 2024	Knowledge DistillationModel Compression	CodeCode Available	1	5
Joint Privacy Enhancement and Quantization in Federated Learning	Aug 23, 2022	Federated LearningPrivacy Preserving	CodeCode Available	1	5
IntraQ: Learning Synthetic Images with Intra-Class Heterogeneity for Zero-Shot Network Quantization	Nov 17, 2021	Quantization	CodeCode Available	1	5
D^2-DPM: Dual Denoising for Quantized Diffusion Probabilistic Models	Jan 14, 2025	DenoisingImage Generation	CodeCode Available	1	5
SimCC: a Simple Coordinate Classification Perspective for Human Pose Estimation	Jul 7, 2021	ClassificationPose Estimation	CodeCode Available	1	5
Benchmarking Quantized Neural Networks on FPGAs with FINN	Feb 2, 2021	BenchmarkingQuantization	CodeCode Available	1	5
BAGUA: Scaling up Distributed Learning with System Relaxations	Jul 3, 2021	Distributed OptimizationQuantization	CodeCode Available	1	5
Data-Free Quantization Through Weight Equalization and Bias Correction	Jun 11, 2019	Data Free Quantizationobject-detection	CodeCode Available	1	5
Analog Foundation Models	May 14, 2025	4kQuantization	CodeCode Available	1	5
Accurate KV Cache Quantization with Outlier Tokens Tracing	May 16, 2025	Quantization	CodeCode Available	1	5
Compress Any Segment Anything Model (SAM)	Jul 11, 2025	modelQuantization	CodeCode Available	1	5
DeCoAR 2.0: Deep Contextualized Acoustic Representations with Vector Quantization	Dec 11, 2020	DiversityQuantization	CodeCode Available	1	5
Beyond Learned Metadata-based Raw Image Reconstruction	Jun 21, 2023	Image CompressionImage Reconstruction	CodeCode Available	1	5
Learning from Students: Applying t-Distributions to Explore Accurate and Efficient Formats for LLMs	May 6, 2024	Quantization	CodeCode Available	1	5
Learning Statistical Texture for Semantic Segmentation	Mar 6, 2021	QuantizationSegmentation	CodeCode Available	1	5
Beyond Preserved Accuracy: Evaluating Loyalty and Robustness of BERT Compression	Sep 7, 2021	Knowledge DistillationQuantization	CodeCode Available	1	5
It's All In the Teacher: Zero-Shot Quantization Brought Closer to the Teacher	Mar 31, 2022	AllData Free Quantization	CodeCode Available	1	5
Deep Geometry Post-Processing for Decompressed Point Clouds	Apr 29, 2022	Quantization	CodeCode Available	1	5
Comprehensive Graph-conditional Similarity Preserving Network for Unsupervised Cross-modal Hashing	Dec 25, 2020	QuantizationRetrieval	CodeCode Available	1	5

Show:10 25 50

← PrevPage 25 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified