Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2676–2700 of 4925 papers

Title	Date	Tasks	Status
Learning Accurate Performance Predictors for Ultrafast Automated Model Compression	Apr 13, 2023	image-classificationImage Classification	CodeCode Available
End-to-end codesign of Hessian-aware quantized neural networks for FPGAs and ASICs	Apr 13, 2023	Quantization	—Unverified
Unsupervised Multi-Criteria Adversarial Detection in Deep Image Retrieval	Apr 9, 2023	Deep HashingDeep Learning	—Unverified
Benchmarking the Robustness of Quantized Models	Apr 8, 2023	BenchmarkingQuantization	—Unverified
Unsupervised Speech Representation Pooling Using Vector Quantization	Apr 8, 2023	Emotion Recognitionintent-classification	CodeCode Available
AutoQNN: An End-to-End Framework for Automatically Quantizing Neural Networks	Apr 7, 2023	Neural Architecture SearchQuantization	—Unverified
FedDiSC: A Computation-efficient Federated Learning Framework for Power Systems Disturbance and Cyber Attack Discrimination	Apr 7, 2023	Federated LearningPrivacy Preserving	—Unverified
Blockwise Compression of Transformer-based Models without Retraining	Apr 4, 2023	Quantization	—Unverified
A Unified Compression Framework for Efficient Speech-Driven Talking-Face Generation	Apr 2, 2023	Face GenerationKnowledge Distillation	—Unverified
Distributed Optimization for Quadratic Cost Functions over Large-Scale Networks with Quantized Communication and Finite-Time Convergence	Apr 2, 2023	Distributed OptimizationFederated Learning	—Unverified
FP8 versus INT8 for efficient deep learning inference	Mar 31, 2023	Deep LearningQuantization	—Unverified
A Joint Model and Data Driven Method for Distributed Estimation	Mar 30, 2023	QuantizationWeather Forecasting	—Unverified
oBERTa: Improving Sparse Transfer Learning via improved initialization, distillation, and pruning regimes	Mar 30, 2023	Knowledge DistillationModel Compression	—Unverified
SC-VAE: Sparse Coding-based Variational Autoencoder with Learned ISTA	Mar 29, 2023	Image GenerationImage Reconstruction	CodeCode Available
Tetra-AML: Automatic Machine Learning via Tensor Networks	Mar 28, 2023	Bayesian OptimizationHyperparameter Optimization	—Unverified
Low-Dose CT Image Reconstruction using Vector Quantized Convolutional Autoencoder with Perceptual Loss	Mar 28, 2023	Computed Tomography (CT)Image Reconstruction	—Unverified
Binarizing Sparse Convolutional Networks for Efficient Point Cloud Analysis	Mar 27, 2023	BinarizationQuantization	—Unverified
An Evaluation of Memory Optimization Methods for Training Neural Networks	Mar 26, 2023	Quantization	—Unverified
LVQAC: Lattice Vector Quantization Coupled with Spatially Adaptive Companding for Efficient Learned Image Compression	Mar 25, 2023	Image CompressionQuantization	—Unverified
Towards Accurate Post-Training Quantization for Vision Transformer	Mar 25, 2023	Model CompressionQuantization	—Unverified
Benchmarking the Reliability of Post-training Quantization: a Particular Focus on Worst-case Performance	Mar 23, 2023	BenchmarkingData Augmentation	—Unverified
The Quantization Model of Neural Scaling	Mar 23, 2023	Language ModelingLanguage Modelling	CodeCode Available
Scaled Quantization for the Vision Transformer	Mar 23, 2023	Quantization	—Unverified
Posthoc Interpretation via Quantization	Mar 22, 2023	Image SegmentationQuantization	—Unverified
Q-HyViT: Post-Training Quantization of Hybrid Vision Transformers with Bridge Block Reconstruction for IoT Systems	Mar 22, 2023	Quantization	CodeCode Available

Show:10 25 50

← PrevPage 108 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified