Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 726–750 of 4925 papers

Title	Date	Tasks	Status	Hype	Score
Broken Neural Scaling Laws	Oct 26, 2022	Adversarial RobustnessContinual Learning	CodeCode Available	1	5
"Lossless" Compression of Deep Neural Networks: A High-dimensional Neural Tangent Kernel Approach	Mar 1, 2024	Model CompressionQuantization	CodeCode Available	1	5
CondiQuant: Condition Number Based Low-Bit Quantization for Image Super-Resolution	Feb 21, 2025	Image Super-ResolutionQuantization	CodeCode Available	1	5
Integer-only Zero-shot Quantization for Efficient Speech Recognition	Mar 31, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1	5
QCM-SGM+: Improved Quantized Compressed Sensing With Score-Based Generative Models	Feb 2, 2023	Bayesian Inferencecompressed sensing	CodeCode Available	1	5
AlignQ: Alignment Quantization With ADMM-Based Correlation Preservation	Jan 1, 2022	Quantization	CodeCode Available	1	5
Conditional Coding and Variable Bitrate for Practical Learned Video Coding	Apr 19, 2021	DecoderQuantization	CodeCode Available	1	5
CABM: Content-Aware Bit Mapping for Single Image Super-Resolution Network with Large Input	Apr 13, 2023	2k4k	CodeCode Available	1	5
COMQ: A Backpropagation-Free Algorithm for Post-Training Quantization	Mar 11, 2024	Quantization	CodeCode Available	1	5
Compression with Bayesian Implicit Neural Representations	May 30, 2023	Audio CompressionQuantization	CodeCode Available	1	5
Adaptive Gradient Quantization for Data-Parallel SGD	Oct 23, 2020	Quantization	CodeCode Available	1	5
Fast Nearest Convolution for Real-Time Efficient Image Super-Resolution	Aug 24, 2022	Image Super-ResolutionQuantization	CodeCode Available	1	5
CADyQ: Content-Aware Dynamic Quantization for Image Super-Resolution	Jul 21, 2022	Image Super-ResolutionQuantization	CodeCode Available	1	5
CalibQuant: 1-Bit KV Cache Quantization for Multimodal LLMs	Feb 15, 2025	Computational EfficiencyGPU	CodeCode Available	1	5
FastText.zip: Compressing text classification models	Dec 12, 2016	General ClassificationQuantization	CodeCode Available	1	5
FAT: Learning Low-Bitwidth Parametric Representation via Frequency-Aware Transformation	Feb 15, 2021	Model CompressionNeural Network Compression	CodeCode Available	1	5
LogicNets: Co-Designed Neural Networks and Circuits for Extreme-Throughput Applications	Apr 6, 2020	Intrusion DetectionNetwork Intrusion Detection	CodeCode Available	1	5
Can Compressed LLMs Truly Act? An Empirical Evaluation of Agentic Capabilities in LLM Compression	May 26, 2025	Language ModelingLanguage Modelling	CodeCode Available	1	5
LogQuant: Log-Distributed 2-Bit Quantization of KV Cache with Superior Accuracy Preservation	Mar 25, 2025	Code CompletionLanguage Modeling	CodeCode Available	1	5
Exploring Frequency-Inspired Optimization in Transformer for Efficient Single Image Super-Resolution	Aug 9, 2023	Image Super-ResolutionQuantization	CodeCode Available	1	5
CE-VAE: Capsule Enhanced Variational AutoEncoder for Underwater Image Enhancement	Jun 3, 2024	Image EnhancementImage Generation	CodeCode Available	1	5
Automatic Joint Structured Pruning and Quantization for Efficient Neural Network Training and Compression	Feb 23, 2025	Efficient Neural NetworkQuantization	CodeCode Available	1	5
CA-SpaceNet: Counterfactual Analysis for 6D Pose Estimation in Space	Jul 16, 2022	6D Pose EstimationCausal Inference	CodeCode Available	1	5
Dataset Quantization with Active Learning based Adaptive Sampling	Jul 9, 2024	Active LearningDataset Distillation	CodeCode Available	1	5
Compressing LLMs: The Truth is Rarely Pure and Never Simple	Oct 2, 2023	QuantizationRetrieval	CodeCode Available	1	5

Show:10 25 50

← PrevPage 30 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified