Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4826–4850 of 4925 papers

Title	Date	Tasks	Status
How Should We Extract Discrete Audio Tokens from Self-Supervised Models?	Jun 15, 2024	QuantizationSelf-Supervised Learning	—Unverified
How to Attain Communication-Efficient DNN Training? Convert, Compress, Correct	Apr 18, 2022	Quantization	—Unverified
How to design a derivatives market?	Sep 19, 2019	Quantization	—Unverified
How to Parameterize Asymmetric Quantization Ranges for Quantization-Aware Training	Apr 25, 2024	Quantization	—Unverified
HPGN: Hybrid Priors-Guided Network for Compressed Low-Light Image Enhancement	Apr 3, 2025	Image EnhancementLow-Light Image Enhancement	—Unverified
HQ-DiT: Efficient Diffusion Transformer with FP4 Hybrid Quantization	May 30, 2024	Quantization	—Unverified
HQNAS: Auto CNN deployment framework for joint quantization and architecture search	Oct 16, 2022	GPUNeural Architecture Search	—Unverified
HQ-VAE: Hierarchical Discrete Representation Learning with Variational Bayes	Dec 31, 2023	QuantizationRepresentation Learning	—Unverified
HRPVT: High-Resolution Pyramid Vision Transformer for medium and small-scale human pose estimation	Oct 29, 2024	Pose EstimationQuantization	—Unverified
Huber-energy measure quantization	Dec 15, 2022	QuantizationStochastic Optimization	—Unverified
Huff-LLM: End-to-End Lossless Compression for Efficient LLM Inference	Feb 2, 2025	Model CompressionQuantization	—Unverified
Human Activity Recognition on Microcontrollers with Quantized and Adaptive Deep Neural Networks	Sep 2, 2022	Activity RecognitionHuman Activity Recognition	—Unverified
Human-level molecular optimization driven by mol-gene evolution	Jun 13, 2024	Drug DiscoveryQuantization	—Unverified
Human Symmetry Uncertainty Detected by a Self-Organizing Neural Network Map	Feb 27, 2021	Quantization	—Unverified
SwiftPrune: Hessian-Free Weight Pruning for Large Language Models	Jan 24, 2025	Model CompressionQuantization	—Unverified
HW-SW Optimization of DNNs for Privacy-preserving People Counting on Low-resolution Infrared Arrays	Feb 2, 2024	Neural Architecture SearchPrivacy Preserving	—Unverified
HW-TSC’s Participation in the WMT 2021 Efficiency Shared Task	Nov 1, 2021	CPUDecoder	—Unverified
Hybrid and Non-Uniform DNN quantization methods using Retro Synthesis data for efficient inference	Jan 1, 2021	Quantization	—Unverified
Hybrid and Non-Uniform quantization methods using retro synthesis data for efficient inference	Dec 26, 2020	Quantization	—Unverified
Hybrid Beamforming for Integrated Sensing and Communications With Low Resolution DACs	Nov 5, 2024	ISACQuantization	—Unverified
HybridFlow: Infusing Continuity into Masked Codebook for Extreme Low-Bitrate Image Compression	Apr 20, 2024	DecoderImage Compression	—Unverified
Hybrid model for Single-Stage Multi-Person Pose Estimation	May 2, 2023	Multi-Person Pose EstimationPose Estimation	—Unverified
Hybrid noise shaping for audio coding using perfectly overlapped window	Aug 24, 2023	Quantization	—Unverified
Hybrid of DiffStride and Spectral Pooling in Convolutional Neural Networks	Jan 17, 2024	Quantization	—Unverified
Hybrid Receiver Design for Massive MIMO-OFDM with Low-Resolution ADCs and Oversampling	Jul 5, 2024	Quantization	—Unverified

Show:10 25 50

← PrevPage 194 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified