Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2926–2950 of 4925 papers

Title	Date	Tasks	Status
Sub-8-Bit Quantization Aware Training for 8-Bit Neural Network Accelerator with On-Device Speech Recognition	Jun 30, 2022	Quantizationspeech-recognition	—Unverified
Sub-8-bit quantization for on-device speech recognition: a regularization-free approach	Oct 17, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Sub 8-Bit Quantization of Streaming Keyword Spotting Models for Embedded Chipsets	Jul 13, 2022	CPUKeyword Spotting	—Unverified
Subgraph Stationary Hardware-Software Inference Co-Design	Jun 21, 2023	Quantization	—Unverified
SUBIC: A supervised, structured binary code for image search	Aug 9, 2017	Deep HashingImage Retrieval	—Unverified
Subjective Quality Database and Objective Study of Compressed Point Clouds With 6DoF Head-Mounted Display	Aug 6, 2020	Point Cloud Quality AssessmentQuantization	—Unverified
Sublinear quantum algorithms for training linear and kernel-based classifiers	Apr 4, 2019	Quantization	—Unverified
Subspace Robust Wasserstein Distances	Jan 25, 2019	Quantization	—Unverified
Subtensor Quantization for Mobilenets	Nov 4, 2020	image-classificationImage Classification	—Unverified
Succinct Compression: Near-Optimal and Lossless Compression of Deep Neural Networks during Inference Runtime	Sep 29, 2021	Quantization	—Unverified
Sum Rate Maximization in the Constant Envelope MIMO Downlink with the RZF Precoder	Nov 5, 2024	Quantization	—Unverified
Super-High-Fidelity Image Compression via Hierarchical-ROI and Adaptive Quantization	Mar 19, 2024	Image CompressionQuantization	—Unverified
Super-relaxation of space-time-quantized ensemble of energy loads to curtail their synchronization after demand response perturbation	Aug 3, 2020	Quantization	—Unverified
Super-Resolution by Predicting Offsets: An Ultra-Efficient Super-Resolution Network for Rasterized Images	Oct 9, 2022	QuantizationSuper-Resolution	—Unverified
Supervised Deep Hashing for High-dimensional and Heterogeneous Case-based Reasoning	Jun 29, 2022	Deep HashingIncremental Learning	—Unverified
Supervised Learning in the Presence of Concept Drift: A modelling framework	May 21, 2020	Quantization	—Unverified
Supervised Matrix Factorization for Cross-Modality Hashing	Apr 16, 2016	QuantizationRetrieval	—Unverified
Supervised Quantization for Similarity Search	Feb 2, 2019	feature selectionGeneral Classification	—Unverified
Support Recovery in Universal One-bit Compressed Sensing	Jul 19, 2021	compressed sensingQuantization	—Unverified
Survey of Quantization Techniques for On-Device Vision-based Crack Detection	Feb 4, 2025	QuantizationStructural Health Monitoring	—Unverified
Sustainable LLM Inference for Edge AI: Evaluating Quantized LLMs for Energy Efficiency, Output Accuracy, and Inference Latency	Apr 4, 2025	BenchmarkingGSM8K	—Unverified
SUT System Description for Anti-Spoofing 2017 Challenge	Nov 1, 2017	QuantizationSpeaker Verification	—Unverified
SVDq: 1.25-bit and 410x Key Cache Compression for LLM Attention	Feb 21, 2025	Quantization	—Unverified
SVGformer: Representation Learning for Continuous Vector Graphics Using Transformers	Jan 1, 2023	QuantizationRepresentation Learning	—Unverified
SWIS -- Shared Weight bIt Sparsity for Efficient Neural Network Acceleration	Mar 1, 2021	Efficient Neural NetworkQuantization	—Unverified

Show:10 25 50

← PrevPage 118 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified