Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4701–4725 of 4925 papers

Title	Date	Tasks	Status
Piggyback: Adapting a Single Network to Multiple Tasks by Learning to Mask Weights	Jan 19, 2018	Continual LearningQuantization	CodeCode Available
Activation Compression of Graph Neural Networks using Block-wise Quantization with Improved Variance Minimization	Sep 21, 2023	GPUQuantization	CodeCode Available
Decoupling Meta-Reinforcement Learning with Gaussian Task Contexts and Skills	Dec 11, 2023	continuous-controlContinuous Control	CodeCode Available
A Simple Low-bit Quantization Framework for Video Snapshot Compressive Imaging	Jul 31, 2024	QuantizationVideo Reconstruction	CodeCode Available
Soft Weight-Sharing for Neural Network Compression	Feb 13, 2017	Neural Network CompressionQuantization	CodeCode Available
Regularized Classification-Aware Quantization	Jul 12, 2021	Binary ClassificationClassification	CodeCode Available
A Model for Every User and Budget: Label-Free and Personalized Mixed-Precision Quantization	Jul 24, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Are You Getting What You Pay For? Auditing Model Substitution in LLM APIs	Apr 7, 2025	BenchmarkingFairness	CodeCode Available
Improving Self-Supervised Learning-based MOS Prediction Networks	Apr 23, 2022	PredictionQuantization	CodeCode Available
David and Goliath: An Empirical Evaluation of Attacks and Defenses for QNNs at the Deep Edge	Apr 8, 2024	Edge-computingQuantization	CodeCode Available
Channel-wise Mixed-precision Assignment for DNN Inference on Constrained Edge Nodes	Jun 17, 2022	Neural Architecture SearchQuantization	CodeCode Available
Efficient Cross-Modal Retrieval via Deep Binary Hashing and Quantization	Feb 15, 2022	Cross-Modal RetrievalDeep Hashing	CodeCode Available
A Mixed Quantization Network for Computationally Efficient Mobile Inverse Tone Mapping	Mar 12, 2022	inverse tone mappingInverse-Tone-Mapping	CodeCode Available
Playing Atari with Six Neurons	Jun 4, 2018	Atari GamesDecision Making	CodeCode Available
PQA: Exploring the Potential of Product Quantization in DNN Hardware Acceleration	May 25, 2023	Quantization	CodeCode Available
Improving Robustness Against Stealthy Weight Bit-Flip Attacks by Output Code Matching	Jan 1, 2022	Quantization	CodeCode Available
PMQ-VE: Progressive Multi-Frame Quantization for Video Enhancement	May 18, 2025	QuantizationVideo Enhancement	CodeCode Available
Improving Neural Network Quantization without Retraining using Outlier Channel Splitting	Jan 28, 2019	Language ModelingLanguage Modelling	CodeCode Available
Relaxed Quantization for Discretized Neural Networks	Oct 3, 2018	General ClassificationQuantization	CodeCode Available
Training High-Performance and Large-Scale Deep Neural Networks with Full 8-bit Integers	Sep 5, 2019	Quantization	CodeCode Available
Improved Knowledge Distillation for Crowd Counting on IoT Device	Aug 2, 2023	Crowd CountingKnowledge Distillation	CodeCode Available
Improved Gradient based Adversarial Attacks for Quantized Networks	Mar 30, 2020	image-classificationImage Classification	CodeCode Available
Central Similarity Quantization for Efficient Image and Video Retrieval	Aug 1, 2019	QuantizationRetrieval	CodeCode Available
Implicit Feature Decoupling with Depthwise Quantization	Mar 15, 2022	DecoderQuantization	CodeCode Available
Data Upcycling Knowledge Distillation for Image Super-Resolution	Sep 25, 2023	Image Super-ResolutionKnowledge Distillation	CodeCode Available

Show:10 25 50

← PrevPage 189 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified