Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 851–900 of 4925 papers

Title	Date	Tasks	Status	Hype
Hierarchical Quantized Autoencoders	Feb 19, 2020	Image CompressionQuantization	CodeCode Available	1
Algorithm-hardware Co-design for Deformable Convolution	Feb 19, 2020	image-classificationImage Classification	CodeCode Available	1
Robust Quantization: One Model to Rule Them All	Feb 18, 2020	Allmodel	CodeCode Available	1
Variational Bayesian Quantization	Feb 18, 2020	Image CompressionModel Compression	CodeCode Available	1
Learning Architectures for Binary Networks	Feb 17, 2020	Quantization	CodeCode Available	1
Precision Gating: Improving Neural Network Efficiency with Dynamic Dual-Precision Activations	Feb 17, 2020	Quantization	CodeCode Available	1
Towards Sharper First-Order Adversary with Quantized Gradients	Feb 1, 2020	Adversarial RobustnessQuantization	CodeCode Available	1
Post-Training Piecewise Linear Quantization for Deep Neural Networks	Jan 31, 2020	image-classificationImage Classification	CodeCode Available	1
Fast, Compact and Highly Scalable Visual Place Recognition through Sequence-based Matching of Overloaded Representations	Jan 23, 2020	Image CompressionQuantization	CodeCode Available	1
Least squares binary quantization of neural networks	Jan 9, 2020	Quantization	CodeCode Available	1
Fractional Skipping: Towards Finer-Grained Dynamic CNN Inference	Jan 3, 2020	Quantization	CodeCode Available	1
Towards Accurate Post-training Network Quantization via Bit-Split and Stitching	Jan 1, 2020	CPUGPU	CodeCode Available	1
ZeroQ: A Novel Zero Shot Quantization Framework	Jan 1, 2020	Data Free QuantizationModel Compression	CodeCode Available	1
Towards Efficient Training for Neural Network Quantization	Dec 21, 2019	Quantization	CodeCode Available	1
MetaQuant: Learning to Quantize by Learning to Penetrate Non-differentiable Quantization	Dec 1, 2019	Quantization	CodeCode Available	1
Online Learned Continual Compression with Adaptive Quantization Modules	Nov 19, 2019	Continual LearningDecoder	CodeCode Available	1
Scientific Image Restoration Anywhere	Nov 12, 2019	CPUDenoising	CodeCode Available	1
HAWQ-V2: Hessian Aware trace-Weighted Quantization of Neural Networks	Nov 10, 2019	object-detectionObject Detection	CodeCode Available	1
Effectiveness of self-supervised pre-training for speech recognition	Nov 10, 2019	Language ModellingQuantization	CodeCode Available	1
ConveRT: Efficient and Accurate Conversational Representations from Transformers	Nov 9, 2019	Conversational Response Selectionintent-classification	CodeCode Available	1
A holistic approach to polyphonic music transcription with neural networks	Oct 26, 2019	Beat TrackingMusic Transcription	CodeCode Available	1
Q8BERT: Quantized 8Bit BERT	Oct 14, 2019	Linguistic AcceptabilityNatural Language Inference	CodeCode Available	1
Improvements to Target-Based 3D LiDAR to Camera Calibration	Oct 7, 2019	Camera CalibrationPose Estimation	CodeCode Available	1
And the Bit Goes Down: Revisiting the Quantization of Neural Networks	Jul 12, 2019	CPUQuantization	CodeCode Available	1
Data-Free Quantization Through Weight Equalization and Bias Correction	Jun 11, 2019	Data Free Quantizationobject-detection	CodeCode Available	1
Mixed Precision DNNs: All you need is a good parametrization	May 27, 2019	AllQuantization	CodeCode Available	1
Learning to Groove with Inverse Sequence Transformations	May 14, 2019	Generative Adversarial NetworkQuantization	CodeCode Available	1
HAWQ: Hessian AWare Quantization of Neural Networks with Mixed-Precision	Apr 29, 2019	Quantization	CodeCode Available	1
Single Path One-Shot Neural Architecture Search with Uniform Sampling	Mar 31, 2019	Neural Architecture SearchQuantization	CodeCode Available	1
Learned Step Size Quantization	Feb 21, 2019	Model CompressionQuantization	CodeCode Available	1
ADMM-NN: An Algorithm-Hardware Co-Design Framework of DNNs Using Alternating Direction Method of Multipliers	Dec 31, 2018	Model CompressionQuantization	CodeCode Available	1
Proximal Mean-field for Neural Network Quantization	Dec 11, 2018	Image ClassificationQuantization	CodeCode Available	1
Trained Rank Pruning for Efficient Deep Neural Networks	Dec 6, 2018	Quantization	CodeCode Available	1
NICE: Noise Injection and Clamping Estimation for Neural Network Quantization	Sep 29, 2018	General ClassificationGPU	CodeCode Available	1
PACT: Parameterized Clipping Activation for Quantized Neural Networks	May 16, 2018	Quantization	CodeCode Available	1
Vision Based Dynamic Offside Line Marker for Soccer Games	Apr 17, 2018	Quantization	CodeCode Available	1
Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference	Dec 15, 2017	General ClassificationQuantization	CodeCode Available	1
Sparse Communication for Distributed Gradient Descent	Apr 17, 2017	General Classificationimage-classification	CodeCode Available	1
FastText.zip: Compressing text classification models	Dec 12, 2016	General ClassificationQuantization	CodeCode Available	1
Trained Ternary Quantization	Dec 4, 2016	Quantization	CodeCode Available	1
Efficient Deployment of Spiking Neural Networks on SpiNNaker2 for DVS Gesture Recognition Using Neuromorphic Intermediate Representation	Sep 4, 2025	Edge-computingGesture Recognition	CodeCode Available	0
An End-to-End DNN Inference Framework for the SpiNNaker2 Neuromorphic MPSoC	Jul 18, 2025	QuantizationScheduling	—Unverified	0
Task-Specific Audio Coding for Machines: Machine-Learned Latent Features Are Codes for That Machine	Jul 17, 2025	Audio ClassificationAutomatic Speech Recognition	—Unverified	0
Angle Estimation of a Single Source with Massive Uniform Circular Arrays	Jul 17, 2025	Quantization	—Unverified	0
Quantized Rank Reduction: A Communications-Efficient Federated Learning Scheme for Network-Critical Applications	Jul 15, 2025	Federated LearningQuantization	—Unverified	0
Lightweight Federated Learning over Wireless Edge Networks	Jul 13, 2025	Bayesian OptimizationFederated Learning	—Unverified	0
Vision Foundation Models as Effective Visual Tokenizers for Autoregressive Image Generation	Jul 11, 2025	Image GenerationImage Reconstruction	—Unverified	0
OpenDPDv2: A Unified Learning and Optimization Framework for Neural Network Digital Predistortion	Jul 9, 2025	Model OptimizationQuantization	—Unverified	0
QS4D: Quantization-aware training for efficient hardware deployment of structured state-space sequential models	Jul 8, 2025	Computational EfficiencyEdge-computing	—Unverified	0
Semantic Certainty Assessment in Vector Retrieval Systems: A Novel Framework for Embedding Quality Evaluation	Jul 8, 2025	Data AugmentationQuantization	—Unverified	0

Show:10 25 50

← PrevPage 18 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified