Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2851–2900 of 4925 papers

Title	Date	Tasks	Status
Sparse Meets Dense: Unified Generative Recommendations with Cascaded Sparse-Dense Representations	Mar 4, 2025	QuantizationRecommendation Systems	—Unverified
Sparse Quantization for Patch Description	Jun 1, 2013	General Classificationimage-classification	—Unverified
Sparse Quantized Spectral Clustering	Oct 3, 2020	ClusteringQuantization	—Unverified
Sparse-SignSGD with Majority Vote for Communication-Efficient Distributed Learning	Feb 15, 2023	Deep LearningDistributed Optimization	—Unverified
Sparse-VQ Transformer: An FFN-Free Framework with Vector Quantization for Enhanced Time Series Forecasting	Feb 8, 2024	Computational EfficiencyMultivariate Time Series Forecasting	—Unverified
Sparsification via Compressed Sensing for Automatic Speech Recognition	Feb 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sparsifying Binary Networks	Jul 11, 2022	BinarizationQuantization	—Unverified
Spatial Sigma-Delta Modulation for Coarsely Quantized Massive MIMO Downlink: Flexible Designs by Convex Optimization	Oct 22, 2023	Quantization	—Unverified
Spatio-Temporal Fluid Dynamics Modeling via Physical-Awareness and Parameter Diffusion Guidance	Mar 18, 2024	Quantization	—Unverified
Spatio-Temporal Pruning and Quantization for Low-latency Spiking Neural Networks	Apr 26, 2021	Model CompressionQuantization	—Unverified
SpAtten: Efficient Sparse Attention Architecture with Cascade Token and Head Pruning	Dec 17, 2020	CPUGPU	—Unverified
SPC-NeRF: Spatial Predictive Compression for Voxel Based Radiance Field	Feb 26, 2024	Image CompressionNeRF	—Unverified
Speaker Diaphragm Excursion Prediction: deep attention and online adaptation	May 11, 2023	Deep AttentionQuantization	—Unverified
Speaker Identification From Youtube Obtained Data	Nov 11, 2014	parameter estimationQuantization	—Unverified
SpeCache: Speculative Key-Value Caching for Efficient Generation of LLMs	Mar 20, 2025	CPUGPU	—Unverified
SpecEE: Accelerating Large Language Model Inference with Speculative Early Exiting	Apr 11, 2025	GPULanguage Modeling	—Unverified
Specialized Transformers: Faster, Smaller and more Accurate NLP Models	Sep 29, 2021	Hard AttentionQuantization	—Unverified
Non-asymptotic spectral bounds on the -entropy of kernel classes	Apr 9, 2022	Quantization	—Unverified
Spectral Clustering with Perturbed Data	Dec 1, 2008	ClusteringQuantization	—Unverified
Spectral Codecs: Improving Non-Autoregressive Speech Synthesis with Spectrogram-Based Audio Codecs	Jun 7, 2024	QuantizationSpeech Synthesis	—Unverified
Spectral-PQ: A Novel Spectral Sensitivity-Orientated Perceptual Compression Technique for RGB 4:4:4 Video Data	Jan 24, 2022	QuantizationSensitivity	—Unverified
Speculative Decoding and Beyond: An In-Depth Review of Techniques	Feb 27, 2025	Quantization	—Unverified
Speech Enhancement Using Continuous Embeddings of Neural Audio Codec	Feb 22, 2025	QuantizationSpeech Enhancement	—Unverified
Speech Enhancement Using Self-Supervised Pre-Trained Model and Vector Quantization	Sep 28, 2022	DecoderDenoising	—Unverified
Speech Enhancement with Multi-granularity Vector Quantization	Feb 16, 2023	DenoisingQuantization	—Unverified
Speed Is All You Need: On-Device Acceleration of Large Diffusion Models via GPU-Aware Optimizations	Apr 21, 2023	AllGPU	—Unverified
Speedup deep learning models on GPU by taking advantage of efficient unstructured pruning and bit-width reduction	Dec 28, 2021	GPUQuantization	—Unverified
SPFQ: A Stochastic Algorithm and Its Error Analysis for Neural Network Quantization	Sep 20, 2023	Quantization	—Unverified
SPIQ: Data-Free Per-Channel Static Input Quantization	Mar 28, 2022	Data Free Quantizationobject-detection	—Unverified
SplitQuant: Layer Splitting for Low-Bit Neural Network Quantization	Jan 21, 2025	Quantization	—Unverified
SQ-DM: Accelerating Diffusion Models with Aggressive Quantization and Temporal Sparsity	Jan 26, 2025	Image GenerationQuantization	—Unverified
sqSGD: Locally Private and Communication Efficient Federated Learning	Jun 21, 2022	Federated LearningPrivacy Preserving	—Unverified
SQuantizer: Simultaneous Learning for Both Sparse and Low-precision Neural Networks	Dec 20, 2018	Machine TranslationNeural Architecture Search	—Unverified
SQuAT: Sharpness- and Quantization-Aware Training for BERT	Oct 13, 2022	Quantization	—Unverified
SQuat: Subspace-orthogonal KV Cache Quantization	Mar 31, 2025	Quantization	—Unverified
SQWA: Stochastic Quantized Weight Averaging for Improving the Generalization Capability of Low-Precision Deep Neural Networks	Feb 2, 2020	Quantization	—Unverified
Stability Analysis of Various Symbolic Rule Extraction Methods from Recurrent Neural Network	Feb 4, 2024	Quantization	—Unverified
Stabilization of an unstable reaction-diffusion PDE with input delay despite state and input quantization	Jan 27, 2025	Quantization	—Unverified
Stabilizing Quantization-Aware Training by Implicit-Regularization on Hessian Matrix	Mar 14, 2025	Neural Network CompressionQuantization	—Unverified
StableQuant: Layer Adaptive Post-Training Quantization for Speech Foundation Models	Apr 21, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Stacked Denoising Autoencoders and Transfer Learning for Immunogold Particles Detection and Recognition	Dec 7, 2017	DenoisingQuantization	—Unverified
StainPIDR: A Pathological Image Decouplingand Reconstruction Method for Stain Normalization Based on Color Vector Quantization and Structure Restaining	Jun 22, 2025	DiagnosticQuantization	—Unverified
Standard Deviation-Based Quantization for Deep Neural Networks	Feb 24, 2022	Quantization	—Unverified
STanH : Parametric Quantization for Variable Rate Learned Image Compression	Oct 1, 2024	DecoderImage Compression	—Unverified
State Machine-based Waveforms for Channels With 1-Bit Quantization and Oversampling With Time-Instance Zero-Crossing Modulation	Jan 28, 2023	Quantization	—Unverified
Static Quantized Radix-2 FFT/IFFT Processor for Constraints Analysis	Jun 10, 2018	Quantization	—Unverified
Statistical Model Compression for Small-Footprint Natural Language Understanding	Jul 19, 2018	Model CompressionNatural Language Understanding	—Unverified
Statistical Modeling of Soft Error Influence on Neural Networks	Oct 12, 2022	Quantization	—Unverified
STDP Based Pruning of Connections and Weight Quantization in Spiking Neural Networks for Energy Efficient Recognition	Oct 12, 2017	General ClassificationQuantization	—Unverified
STEPS: Sequential Probability Tensor Estimation for Text-to-Image Hard Prompt Search	Jan 1, 2025	Computational EfficiencyQuantization	—Unverified

Show:10 25 50

← PrevPage 58 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified