Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2276–2300 of 4925 papers

Title	Date	Tasks	Status
IQNet: Image Quality Assessment Guided Just Noticeable Difference Prefiltering For Versatile Video Coding	Dec 15, 2023	Image Quality AssessmentQuantization	—Unverified
Adaptive Computation Modules: Granular Conditional Computation For Efficient Inference	Dec 15, 2023	Quantizationspeech-recognition	CodeCode Available
Design Space Exploration of Low-Bit Quantized Neural Networks for Visual Place Recognition	Dec 14, 2023	QuantizationVisual Place Recognition	—Unverified
USM-Lite: Quantization and Sparsity Aware Fine-tuning for Speech Recognition with Universal Speech Models	Dec 13, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
CBQ: Cross-Block Quantization for Large Language Models	Dec 13, 2023	GPUQuantization	—Unverified
When Bio-Inspired Computing meets Deep Learning: Low-Latency, Accurate, & Energy-Efficient Spiking Neural Networks from Artificial Neural Networks	Dec 12, 2023	Quantization	—Unverified
Expand-and-Quantize: Unsupervised Semantic Segmentation Using High-Dimensional Space and Product Quantization	Dec 12, 2023	ClusteringDimensionality Reduction	—Unverified
IDKM: Memory Efficient Neural Network Quantization via Implicit, Differentiable k-Means	Dec 12, 2023	Efficient Neural NetworkQuantization	—Unverified
Decoupling Meta-Reinforcement Learning with Gaussian Task Contexts and Skills	Dec 11, 2023	continuous-controlContinuous Control	CodeCode Available
FP8-BERT: Post-Training Quantization for Transformer	Dec 10, 2023	Quantization	—Unverified
QMGeo: Differentially Private Federated Learning via Stochastic Quantization with Mixed Truncated Geometric Distribution	Dec 10, 2023	Federated LearningQuantization	—Unverified
Neural Architecture Codesign for Fast Bragg Peak Analysis	Dec 10, 2023	AutoMLModel Compression	—Unverified
Agile-Quant: Activation-Guided Quantization for Faster Inference of LLMs on the Edge	Dec 9, 2023	Language ModelingLanguage Modelling	CodeCode Available
Efficient Quantization Strategies for Latent Diffusion Models	Dec 9, 2023	Image GenerationQuantization	—Unverified
Automotive Radar Sensing with Sparse Linear Arrays Using One-Bit Hankel Matrix Completion	Dec 9, 2023	Matrix CompletionQuantization	—Unverified
Understanding the Effect of Model Compression on Social Bias in Large Language Models	Dec 9, 2023	Knowledge DistillationModel Compression	CodeCode Available
An Experimental Study: Assessing the Combined Framework of WavLM and BEST-RQ for Text-to-Speech Synthesis	Dec 8, 2023	BenchmarkingQuantization	—Unverified
GenQ: Quantization in Low Data Regimes with Generative Synthetic Data	Dec 7, 2023	Computational EfficiencyQuantization	CodeCode Available
Rate-splitting Multiple Access for Hierarchical HAP-LAP Networks under Limited Fronthaul	Dec 7, 2023	Quantization	—Unverified
Enhancing Kinship Verification through Multiscale Retinex and Combined Deep-Shallow features	Dec 6, 2023	Kinship VerificationQuantization	—Unverified
All Rivers Run to the Sea: Private Learning with Asymmetric Flows	Dec 5, 2023	AllQuantization	—Unverified
Unified learning-based lossy and lossless JPEG recompression	Dec 5, 2023	Image CompressionQuantization	—Unverified
PLUM: Improving Inference Efficiency By Leveraging Repetition-Sparsity Trade-Off	Dec 4, 2023	BinarizationComputational Efficiency	CodeCode Available
Low-Precision Mixed-Computation Models for Inference on Edge	Dec 3, 2023	Quantization	—Unverified
QuantAttack: Exploiting Dynamic Quantization to Attack Vision Transformers	Dec 3, 2023	Quantization	CodeCode Available

Show:10 25 50

← PrevPage 92 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified