Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2876–2900 of 4925 papers

Title	Date	Tasks	Status
Speed Is All You Need: On-Device Acceleration of Large Diffusion Models via GPU-Aware Optimizations	Apr 21, 2023	AllGPU	—Unverified
Speedup deep learning models on GPU by taking advantage of efficient unstructured pruning and bit-width reduction	Dec 28, 2021	GPUQuantization	—Unverified
SPFQ: A Stochastic Algorithm and Its Error Analysis for Neural Network Quantization	Sep 20, 2023	Quantization	—Unverified
SPIQ: Data-Free Per-Channel Static Input Quantization	Mar 28, 2022	Data Free Quantizationobject-detection	—Unverified
SplitQuant: Layer Splitting for Low-Bit Neural Network Quantization	Jan 21, 2025	Quantization	—Unverified
SQ-DM: Accelerating Diffusion Models with Aggressive Quantization and Temporal Sparsity	Jan 26, 2025	Image GenerationQuantization	—Unverified
sqSGD: Locally Private and Communication Efficient Federated Learning	Jun 21, 2022	Federated LearningPrivacy Preserving	—Unverified
SQuantizer: Simultaneous Learning for Both Sparse and Low-precision Neural Networks	Dec 20, 2018	Machine TranslationNeural Architecture Search	—Unverified
SQuAT: Sharpness- and Quantization-Aware Training for BERT	Oct 13, 2022	Quantization	—Unverified
SQuat: Subspace-orthogonal KV Cache Quantization	Mar 31, 2025	Quantization	—Unverified
SQWA: Stochastic Quantized Weight Averaging for Improving the Generalization Capability of Low-Precision Deep Neural Networks	Feb 2, 2020	Quantization	—Unverified
Stability Analysis of Various Symbolic Rule Extraction Methods from Recurrent Neural Network	Feb 4, 2024	Quantization	—Unverified
Stabilization of an unstable reaction-diffusion PDE with input delay despite state and input quantization	Jan 27, 2025	Quantization	—Unverified
Stabilizing Quantization-Aware Training by Implicit-Regularization on Hessian Matrix	Mar 14, 2025	Neural Network CompressionQuantization	—Unverified
StableQuant: Layer Adaptive Post-Training Quantization for Speech Foundation Models	Apr 21, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Stacked Denoising Autoencoders and Transfer Learning for Immunogold Particles Detection and Recognition	Dec 7, 2017	DenoisingQuantization	—Unverified
StainPIDR: A Pathological Image Decouplingand Reconstruction Method for Stain Normalization Based on Color Vector Quantization and Structure Restaining	Jun 22, 2025	DiagnosticQuantization	—Unverified
Standard Deviation-Based Quantization for Deep Neural Networks	Feb 24, 2022	Quantization	—Unverified
STanH : Parametric Quantization for Variable Rate Learned Image Compression	Oct 1, 2024	DecoderImage Compression	—Unverified
State Machine-based Waveforms for Channels With 1-Bit Quantization and Oversampling With Time-Instance Zero-Crossing Modulation	Jan 28, 2023	Quantization	—Unverified
Static Quantized Radix-2 FFT/IFFT Processor for Constraints Analysis	Jun 10, 2018	Quantization	—Unverified
Statistical Model Compression for Small-Footprint Natural Language Understanding	Jul 19, 2018	Model CompressionNatural Language Understanding	—Unverified
Statistical Modeling of Soft Error Influence on Neural Networks	Oct 12, 2022	Quantization	—Unverified
STDP Based Pruning of Connections and Weight Quantization in Spiking Neural Networks for Energy Efficient Recognition	Oct 12, 2017	General ClassificationQuantization	—Unverified
STEPS: Sequential Probability Tensor Estimation for Text-to-Image Hard Prompt Search	Jan 1, 2025	Computational EfficiencyQuantization	—Unverified

Show:10 25 50

← PrevPage 116 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified