Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2851–2875 of 4925 papers

Title	Date	Tasks	Status
Sparse Meets Dense: Unified Generative Recommendations with Cascaded Sparse-Dense Representations	Mar 4, 2025	QuantizationRecommendation Systems	—Unverified
Sparse Quantization for Patch Description	Jun 1, 2013	General Classificationimage-classification	—Unverified
Sparse Quantized Spectral Clustering	Oct 3, 2020	ClusteringQuantization	—Unverified
Sparse-SignSGD with Majority Vote for Communication-Efficient Distributed Learning	Feb 15, 2023	Deep LearningDistributed Optimization	—Unverified
Sparse-VQ Transformer: An FFN-Free Framework with Vector Quantization for Enhanced Time Series Forecasting	Feb 8, 2024	Computational EfficiencyMultivariate Time Series Forecasting	—Unverified
Sparsification via Compressed Sensing for Automatic Speech Recognition	Feb 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sparsifying Binary Networks	Jul 11, 2022	BinarizationQuantization	—Unverified
Spatial Sigma-Delta Modulation for Coarsely Quantized Massive MIMO Downlink: Flexible Designs by Convex Optimization	Oct 22, 2023	Quantization	—Unverified
Spatio-Temporal Fluid Dynamics Modeling via Physical-Awareness and Parameter Diffusion Guidance	Mar 18, 2024	Quantization	—Unverified
Spatio-Temporal Pruning and Quantization for Low-latency Spiking Neural Networks	Apr 26, 2021	Model CompressionQuantization	—Unverified
SpAtten: Efficient Sparse Attention Architecture with Cascade Token and Head Pruning	Dec 17, 2020	CPUGPU	—Unverified
SPC-NeRF: Spatial Predictive Compression for Voxel Based Radiance Field	Feb 26, 2024	Image CompressionNeRF	—Unverified
Speaker Diaphragm Excursion Prediction: deep attention and online adaptation	May 11, 2023	Deep AttentionQuantization	—Unverified
Speaker Identification From Youtube Obtained Data	Nov 11, 2014	parameter estimationQuantization	—Unverified
SpeCache: Speculative Key-Value Caching for Efficient Generation of LLMs	Mar 20, 2025	CPUGPU	—Unverified
SpecEE: Accelerating Large Language Model Inference with Speculative Early Exiting	Apr 11, 2025	GPULanguage Modeling	—Unverified
Specialized Transformers: Faster, Smaller and more Accurate NLP Models	Sep 29, 2021	Hard AttentionQuantization	—Unverified
Non-asymptotic spectral bounds on the -entropy of kernel classes	Apr 9, 2022	Quantization	—Unverified
Spectral Clustering with Perturbed Data	Dec 1, 2008	ClusteringQuantization	—Unverified
Spectral Codecs: Improving Non-Autoregressive Speech Synthesis with Spectrogram-Based Audio Codecs	Jun 7, 2024	QuantizationSpeech Synthesis	—Unverified
Spectral-PQ: A Novel Spectral Sensitivity-Orientated Perceptual Compression Technique for RGB 4:4:4 Video Data	Jan 24, 2022	QuantizationSensitivity	—Unverified
Speculative Decoding and Beyond: An In-Depth Review of Techniques	Feb 27, 2025	Quantization	—Unverified
Speech Enhancement Using Continuous Embeddings of Neural Audio Codec	Feb 22, 2025	QuantizationSpeech Enhancement	—Unverified
Speech Enhancement Using Self-Supervised Pre-Trained Model and Vector Quantization	Sep 28, 2022	DecoderDenoising	—Unverified
Speech Enhancement with Multi-granularity Vector Quantization	Feb 16, 2023	DenoisingQuantization	—Unverified

Show:10 25 50

← PrevPage 115 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified