Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 601–625 of 4925 papers

Title	Date	Tasks	Status	Hype
Efficient Quantized Sparse Matrix Operations on Tensor Cores	Sep 14, 2022	GPUQuantization	CodeCode Available	1
Exploring the Connection Between Binary and Spiking Neural Networks	Feb 24, 2020	BinarizationQuantization	CodeCode Available	1
Fast Lossless Neural Compression with Integer-Only Discrete Flows	Jun 17, 2022	Quantization	CodeCode Available	1
BinaryHPE: 3D Human Pose and Shape Estimation via Binarization	Nov 24, 2023	3D human pose and shape estimationBinarization	CodeCode Available	1
BED: A Real-Time Object Detection System for Edge Devices	Feb 14, 2022	object-detectionObject Detection	CodeCode Available	1
Fast and Low-Cost Genomic Foundation Models via Outlier Removal	May 1, 2025	Adversarial AttackAdversarial Robustness	CodeCode Available	1
GAN Slimming: All-in-One GAN Compression by A Unified Optimization Framework	Aug 25, 2020	AllImage-to-Image Translation	CodeCode Available	1
DVD-Quant: Data-free Video Diffusion Transformers Quantization	May 24, 2025	Data Free QuantizationQuantization	CodeCode Available	1
Fast Nearest Convolution for Real-Time Efficient Image Super-Resolution	Aug 24, 2022	Image Super-ResolutionQuantization	CodeCode Available	1
Fast-SNN: Fast Spiking Neural Network by Converting Quantized ANN	May 31, 2023	image-classificationImage Classification	CodeCode Available	1
Dynamic Dual Trainable Bounds for Ultra-low Precision Super-Resolution Networks	Mar 8, 2022	QuantizationSuper-Resolution	CodeCode Available	1
Benchmarking Quantized Neural Networks on FPGAs with FINN	Feb 2, 2021	BenchmarkingQuantization	CodeCode Available	1
Exploring Frequency-Inspired Optimization in Transformer for Efficient Single Image Super-Resolution	Aug 9, 2023	Image Super-ResolutionQuantization	CodeCode Available	1
Feature Quantization Improves GAN Training	Apr 5, 2020	Conditional Image GenerationFace Generation	CodeCode Available	1
DQ-BART: Efficient Sequence-to-Sequence Model via Joint Distillation and Quantization	Mar 21, 2022	Knowledge DistillationModel Compression	CodeCode Available	1
Few shot font generation via transferring similarity guided global style and quantization local style	Sep 2, 2023	DisentanglementFont Generation	CodeCode Available	1
DQS3D: Densely-matched Quantization-aware Semi-supervised 3D Detection	Apr 25, 2023	3D Object Detectionobject-detection	CodeCode Available	1
FIMA-Q: Post-Training Quantization for Vision Transformers by Fisher Information Matrix Approximation	Jun 13, 2025	Model CompressionQuantization	CodeCode Available	1
Dynamic Network Quantization for Efficient Video Inference	Aug 23, 2021	QuantizationVideo Recognition	CodeCode Available	1
Fine-grained Data Distribution Alignment for Post-Training Quantization	Sep 9, 2021	Quantization	CodeCode Available	1
Finite Scalar Quantization: VQ-VAE Made Simple	Sep 27, 2023	ColorizationDepth Estimation	CodeCode Available	1
Beyond Preserved Accuracy: Evaluating Loyalty and Robustness of BERT Compression	Sep 7, 2021	Knowledge DistillationQuantization	CodeCode Available	1
BAFFLE: A Baseline of Backpropagation-Free Federated Learning	Jan 28, 2023	Federated LearningQuantization	CodeCode Available	1
Do Emergent Abilities Exist in Quantized Large Language Models: An Empirical Study	Jul 16, 2023	In-Context LearningInstruction Following	CodeCode Available	1
Catastrophic Failure of LLM Unlearning via Quantization	Oct 21, 2024	Machine UnlearningQuantization	CodeCode Available	1

Show:10 25 50

← PrevPage 25 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified