Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 576–600 of 4925 papers

Title	Date	Tasks	Status	Hype	Score
Designing Large Foundation Models for Efficient Training and Inference: A Survey	Sep 3, 2024	Knowledge DistillationModel Compression	CodeCode Available	1	5
It's All In the Teacher: Zero-Shot Quantization Brought Closer to the Teacher	Mar 31, 2022	AllData Free Quantization	CodeCode Available	1	5
Conditional Coding and Variable Bitrate for Practical Learned Video Coding	Apr 19, 2021	DecoderQuantization	CodeCode Available	1	5
IntLoRA: Integral Low-rank Adaptation of Quantized Diffusion Models	Oct 29, 2024	parameter-efficient fine-tuningQuantization	CodeCode Available	1	5
IntraQ: Learning Synthetic Images with Intra-Class Heterogeneity for Zero-Shot Network Quantization	Nov 17, 2021	Quantization	CodeCode Available	1	5
Bayesian Bits: Unifying Quantization and Pruning	May 14, 2020	Quantization	CodeCode Available	1	5
Compression with Bayesian Implicit Neural Representations	May 30, 2023	Audio CompressionQuantization	CodeCode Available	1	5
GenoArmory: A Unified Evaluation Framework for Adversarial Attacks on Genomic Foundation Models	May 16, 2025	Adversarial AttackAdversarial Defense	CodeCode Available	1	5
SimCC: a Simple Coordinate Classification Perspective for Human Pose Estimation	Jul 7, 2021	ClassificationPose Estimation	CodeCode Available	1	5
Join the High Accuracy Club on ImageNet with A Binary Neural Network Ticket	Nov 23, 2022	Data AugmentationKnowledge Distillation	CodeCode Available	1	5
Improving Neural Network Efficiency via Post-Training Quantization With Adaptive Floating-Point	Jan 1, 2021	Model CompressionQuantization	CodeCode Available	1	5
Improving Post Training Neural Quantization: Layer-wise Calibration and Integer Programming	Jun 14, 2020	Model CompressionQuantization	CodeCode Available	1	5
Compress Any Segment Anything Model (SAM)	Jul 11, 2025	modelQuantization	CodeCode Available	1	5
Compressing LLMs: The Truth is Rarely Pure and Never Simple	Oct 2, 2023	QuantizationRetrieval	CodeCode Available	1	5
Improving Detail in Pluralistic Image Inpainting with Feature Dequantization	Dec 2, 2024	Image InpaintingQuantization	CodeCode Available	1	5
A Memory Efficient Baseline for Open Domain Question Answering	Dec 30, 2020	Dimensionality ReductionOpen-Domain Question Answering	CodeCode Available	1	5
BAND-2k: Banding Artifact Noticeable Database for Banding Detection and Quality Assessment	Nov 29, 2023	2kImage Quality Assessment	CodeCode Available	1	5
Image Compression with Recurrent Neural Network and Generalized Divisive Normalization	Sep 5, 2021	DecoderImage Compression	CodeCode Available	1	5
Comprehensive Graph-conditional Similarity Preserving Network for Unsupervised Cross-modal Hashing	Dec 25, 2020	QuantizationRetrieval	CodeCode Available	1	5
COMQ: A Backpropagation-Free Algorithm for Post-Training Quantization	Mar 11, 2024	Quantization	CodeCode Available	1	5
INT-FP-QSim: Mixed Precision and Formats For Large Language Models and Vision Transformers	Jul 7, 2023	Quantization	CodeCode Available	1	5
CondiQuant: Condition Number Based Low-Bit Quantization for Image Super-Resolution	Feb 21, 2025	Image Super-ResolutionQuantization	CodeCode Available	1	5
BBS: Bi-directional Bit-level Sparsity for Deep Learning Acceleration	Sep 8, 2024	Deep LearningQuantization	CodeCode Available	1	5
Improvements to Target-Based 3D LiDAR to Camera Calibration	Oct 7, 2019	Camera CalibrationPose Estimation	CodeCode Available	1	5
Inducing Systematicity in Transformers by Attending to Structurally Quantized Embeddings	Feb 9, 2024	Machine TranslationQuantization	CodeCode Available	1	5

Show:10 25 50

← PrevPage 24 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified