Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2001–2025 of 4925 papers

Title	Date	Tasks	Status
Gradient _1 Regularization for Quantization Robustness	Feb 18, 2020	Quantization	—Unverified
Gradient-Free Neural Network Training on the Edge	Oct 13, 2024	Quantization	—Unverified
Don't Fear the Bit Flips: Optimized Coding Strategies for Binary Classification	Mar 8, 2017	Binary ClassificationGeneral Classification	—Unverified
GradiVeQ: Vector Quantization for Bandwidth-Efficient Gradient Aggregation in Distributed CNN Training	Nov 8, 2018	Dimensionality ReductionQuantization	—Unverified
Domain Generalization on Efficient Acoustic Scene Classification using Residual Normalization	Nov 12, 2021	Acoustic Scene ClassificationClassification	—Unverified
Granger Causality from Quantized Measurements	Jun 3, 2021	Gaussian ProcessesQuantization	—Unverified
Countering Adversarial Examples: Combining Input Transformation and Noisy Training	Jun 25, 2021	Data AugmentationQuantization	—Unverified
GranQ: Granular Zero-Shot Quantization with Channel-Wise Activation Scaling in QAT	Mar 24, 2025	Neural Network CompressionQuantization	—Unverified
Graph-Based Depth Denoising & Dequantization for Point Cloud Enhancement	Nov 9, 2021	DenoisingGraph Learning	—Unverified
Graph-Collaborated Auto-Encoder Hashing for Multi-view Binary Clustering	Jan 6, 2023	ClusteringQuantization	—Unverified
BiSup: Bidirectional Quantization Error Suppression for Large Language Models	May 24, 2024	parameter-efficient fine-tuningQuantization	—Unverified
AdaComp : Adaptive Residual Gradient Compression for Data-Parallel Distributed Training	Dec 7, 2017	Quantization	—Unverified
Greedy Selection for Heterogeneous Sensors	Jul 3, 2023	Quantization	—Unverified
Greener yet Powerful: Taming Large Code Generation Models with Quantization	Mar 9, 2023	Code GenerationCode Summarization	—Unverified
HoloFormer: Deep Compression of Pre-Trained Transforms via Unified Optimization of N:M Sparsity and Integer Quantization	Sep 29, 2021	Quantization	—Unverified
Does Video Compression Impact Tracking Accuracy?	Feb 2, 2022	Multiple Object TrackingObject	—Unverified
BiQGEMM: Matrix Multiplication with Lookup Table For Binary-Coding-based Quantized DNNs	May 20, 2020	Quantization	—Unverified
Gridless Angular Domain Channel Estimation for mmWave Massive MIMO System With One-Bit Quantization Via Approximate Message Passing	Sep 23, 2019	compressed sensingQuantization	—Unverified
Gridless Multisnapshot Variational Line Spectral Estimation from Coarsely Quantized Samples	Jun 20, 2019	Quantization	—Unverified
Group channel pruning and spatial attention distilling for object detection	Jun 2, 2023	Knowledge DistillationModel Compression	—Unverified
Grouped Sequency-arranged Rotation: Optimizing Rotation Transformation for Quantization for Free	May 2, 2025	Quantization	—Unverified
Group Invariant Deep Representations for Image Instance Retrieval	Jan 9, 2016	Dimensionality Reductionimage-classification	—Unverified
An Empirical Study of Low Precision Quantization for TinyML	Mar 10, 2022	BIG-bench Machine LearningModel Compression	—Unverified
GroupReduce: Block-Wise Low-Rank Approximation for Neural Language Model Shrinking	Jun 18, 2018	Language ModelingLanguage Modelling	—Unverified
Does compressing activations help model parallel training?	Jan 6, 2023	modelQuantization	—Unverified

Show:10 25 50

← PrevPage 81 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified