Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 776–800 of 4925 papers

Title	Date	Tasks	Status	Hype	Score
Generating Diverse Structure for Image Inpainting With Hierarchical VQ-VAE	Mar 18, 2021	Image InpaintingQuantization	CodeCode Available	1	5
APHQ-ViT: Post-Training Quantization with Average Perturbation Hessian Based Reconstruction for Vision Transformers	Apr 3, 2025	Quantization	CodeCode Available	1	5
Raw Image Reconstruction with Learned Compact Metadata	Feb 25, 2023	Image CompressionImage Reconstruction	CodeCode Available	1	5
Matching-oriented Embedding Quantization For Ad-hoc Retrieval	Nov 1, 2021	QuantizationRetrieval	CodeCode Available	1	5
Generative Adversarial Super-Resolution at the Edge with Knowledge Distillation	Sep 7, 2022	CPUGenerative Adversarial Network	CodeCode Available	1	5
Generative Low-bitwidth Data Free Quantization	Mar 7, 2020	Data Free QuantizationQuantization	CodeCode Available	1	5
Genetic Quantization-Aware Approximation for Non-Linear Operations in Transformers	Mar 28, 2024	QuantizationSemantic Segmentation	CodeCode Available	1	5
Designing Large Foundation Models for Efficient Training and Inference: A Survey	Sep 3, 2024	Knowledge DistillationModel Compression	CodeCode Available	1	5
Confounding Tradeoffs for Neural Network Quantization	Feb 12, 2021	Quantization	CodeCode Available	1	5
Making DensePose fast and light	Jun 26, 2020	3D Human Pose EstimationGPU	CodeCode Available	1	5
Context-aware Communication for Multi-agent Reinforcement Learning	Dec 25, 2023	Multi-agent Reinforcement LearningQuantization	CodeCode Available	1	5
MagR: Weight Magnitude Reduction for Enhancing Post-Training Quantization	Jun 2, 2024	Quantization	CodeCode Available	1	5
APNN-TC: Accelerating Arbitrary Precision Neural Networks on Ampere GPU Tensor Cores	Jun 23, 2021	GPUQuantization	CodeCode Available	1	5
Textless Unit-to-Unit training for Many-to-Many Multilingual Speech-to-Speech Translation	Aug 3, 2023	DecoderQuantization	CodeCode Available	1	5
Gradient-based Automatic Mixed Precision Quantization for Neural Networks On-Chip	May 1, 2024	Jet TaggingQuantization	CodeCode Available	1	5
COMQ: A Backpropagation-Free Algorithm for Post-Training Quantization	Mar 11, 2024	Quantization	CodeCode Available	1	5
Algorithm-hardware Co-design for Deformable Convolution	Feb 19, 2020	image-classificationImage Classification	CodeCode Available	1	5
CondiQuant: Condition Number Based Low-Bit Quantization for Image Super-Resolution	Feb 21, 2025	Image Super-ResolutionQuantization	CodeCode Available	1	5
RepCodec: A Speech Representation Codec for Speech Tokenization	Aug 31, 2023	Language ModelingLanguage Modelling	CodeCode Available	1	5
LSQ+: Improving low-bit quantization through learnable offsets and better initialization	Apr 20, 2020	Image ClassificationQuantization	CodeCode Available	1	5
Conditional Coding and Variable Bitrate for Practical Learned Video Coding	Apr 19, 2021	DecoderQuantization	CodeCode Available	1	5
Guided Hybrid Quantization for Object detection in Multimodal Remote Sensing Imagery via One-to-one Self-teaching	Dec 31, 2022	object-detectionObject Detection	CodeCode Available	1	5
Resolution Switchable Networks for Runtime Efficient Image Recognition	Jul 19, 2020	Knowledge DistillationQuantization	CodeCode Available	1	5
M^3GPT: An Advanced Multimodal, Multitask Framework for Motion Comprehension and Generation	May 25, 2024	Language ModelingLanguage Modelling	CodeCode Available	1	5
Machine Unlearning of Federated Clusters	Oct 28, 2022	ClusteringFederated Learning	CodeCode Available	1	5

Show:10 25 50

← PrevPage 32 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified