Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2601–2625 of 4925 papers

Title	Date	Tasks	Status
Implementation of a framework for deploying AI inference engines in FPGAs	May 30, 2023	QuantizationResynthesis	—Unverified
Low Precision Quantization-aware Training in Spiking Neural Networks with Differentiable Quantization Function	May 30, 2023	Edge-computingQuantization	—Unverified
Intriguing Properties of Quantization at Scale	May 30, 2023	Quantization	—Unverified
Stochastic Gradient Langevin Dynamics Based on Quantization with Increasing Resolution	May 30, 2023	Quantization	—Unverified
DeCoR: Defy Knowledge Forgetting by Predicting Earlier Audio Codes	May 29, 2023	Acoustic Scene ClassificationContinual Learning	—Unverified
Global-QSGD: Practical Floatless Quantization for Distributed Learning with Theoretical Guarantees	May 29, 2023	Quantization	—Unverified
Reducing Communication for Split Learning by Randomized Top-k Sparsification	May 29, 2023	Federated LearningQuantization	—Unverified
BRICS: Bi-level feature Representation of Image CollectionS	May 29, 2023	DecoderImage Generation	—Unverified
SlimFit: Memory-Efficient Fine-Tuning of Transformer-based Models Using Training Dynamics	May 29, 2023	GPUQuantization	—Unverified
Reversible Quantization Index Modulation for Static Deep Neural Network Watermarking	May 29, 2023	Quantization	—Unverified
A Transfer Learning and Explainable Solution to Detect mpox from Smartphones images	May 29, 2023	image-classificationImage Classification	CodeCode Available
Efficient Storage of Fine-Tuned Models via Low-Rank Approximation of Weight Residuals	May 28, 2023	Quantization	—Unverified
Examining the Role and Limits of Batchnorm Optimization to Mitigate Diverse Hardware-noise in In-memory Computing	May 28, 2023	Quantization	—Unverified
2-bit Conformer quantization for automatic speech recognition	May 26, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Scissorhands: Exploiting the Persistence of Importance Hypothesis for LLM KV Cache Compression at Test Time	May 26, 2023	Quantization	—Unverified
PQA: Exploring the Potential of Product Quantization in DNN Hardware Acceleration	May 25, 2023	Quantization	CodeCode Available
BinaryViT: Towards Efficient and Accurate Binary Vision Transformers	May 24, 2023	BinarizationQuantization	—Unverified
Just CHOP: Embarrassingly Simple LLM Compression	May 24, 2023	Knowledge DistillationLanguage Modeling	—Unverified
RAND: Robustness Aware Norm Decay For Quantized Seq2seq Models	May 24, 2023	Machine TranslationModel Compression	—Unverified
Downlink Clustering-Based Scheduling of IRS-Assisted Communications With Reconfiguration Constraints	May 23, 2023	ClusteringQuantization	—Unverified
Memory-Efficient Fine-Tuning of Compressed Large Language Models via sub-4-bit Integer Quantization	May 23, 2023	In-Context LearningLanguage Modeling	—Unverified
Combining Multi-Objective Bayesian Optimization with Reinforcement Learning for TinyML	May 23, 2023	Bayesian OptimizationHyperparameter Optimization	—Unverified
Adversarial Defenses via Vector Quantization	May 23, 2023	Quantization	—Unverified
Differential Privacy with Random Projections and Sign Random Projections	May 22, 2023	Information RetrievalQuantization	—Unverified
TSPTQ-ViT: Two-scaled post-training quantization for vision transformer	May 22, 2023	Quantization	—Unverified

Show:10 25 50

← PrevPage 105 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified