Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3676–3700 of 4925 papers

Title	Date	Tasks	Status	Hype
Comparing Fisher Information Regularization with Distillation for DNN Quantization	Oct 19, 2020	Knowledge DistillationQuantization	—Unverified	0
Robustness-aware 2-bit quantization with real-time performance for neural network	Oct 19, 2020	Generative Adversarial NetworkQuantization	—Unverified	0
FTBNN: Rethinking Non-linearity for 1-bit CNNs and Going Beyond	Oct 19, 2020	Image ClassificationQuantization	CodeCode Available	0
Check-N-Run: A Checkpointing System for Training Deep Learning Recommendation Models	Oct 17, 2020	QuantizationRecommendation Systems	—Unverified	0
CQ-VAE: Coordinate Quantized VAE for Uncertainty Estimation with Application to Disk Shape Analysis from Lumbar Spine MRI Images	Oct 17, 2020	Quantization	—Unverified	0
Volumetric Calculation of Quantization Error in 3-D Vision Systems	Oct 16, 2020	Quantization	—Unverified	0
Federated Learning in Adversarial Settings	Oct 15, 2020	Federated LearningQuantization	—Unverified	0
FPRaker: A Processing Element For Accelerating Neural Network Training	Oct 15, 2020	Quantization	—Unverified	0
Towards Accurate Quantization and Pruning via Data-free Knowledge Transfer	Oct 14, 2020	Data Free QuantizationQuantization	—Unverified	0
An Investigation on Different Underlying Quantization Schemes for Pre-trained Language Models	Oct 14, 2020	ClusteringQuantization	—Unverified	0
Enhancement Of Coded Speech Using a Mask-Based Post-Filter	Oct 12, 2020	DecoderQuantization	—Unverified	0
Real-time Mask Detection on Google Edge TPU	Oct 9, 2020	Quantization	—Unverified	0
Once Quantization-Aware Training: High Performance Extremely Low-bit Architecture Search	Oct 9, 2020	Neural Architecture SearchQuantization	CodeCode Available	1
3DMolNet: A Generative Network for Molecular Structures	Oct 8, 2020	QuantizationTranslation	—Unverified	0
AxFormer: Accuracy-driven Approximation of Transformers for Faster, Smaller and more Accurate NLP Models	Oct 7, 2020	Hard AttentionQuantization	CodeCode Available	0
Optimal Gradient Compression for Distributed and Federated Learning	Oct 7, 2020	Federated LearningQuantization	—Unverified	0
Characterising Bias in Compressed Models	Oct 6, 2020	FairnessQuantization	—Unverified	0
Joint Pruning & Quantization for Extremely Sparse Neural Networks	Oct 5, 2020	Depth EstimationQuantization	—Unverified	0
Sparse Quantized Spectral Clustering	Oct 3, 2020	ClusteringQuantization	—Unverified	0
GECKO: Reconciling Privacy, Accuracy and Efficiency in Embedded Deep Learning	Oct 2, 2020	Deep LearningModel Compression	—Unverified	0
Compress Polyphone Pronunciation Prediction Model with Shared Labels	Oct 1, 2020	PredictionQuantization	—Unverified	0
BiLiMO: Bit-Limited MIMO Radar via Task-Based Quantization	Oct 1, 2020	Quantization	—Unverified	0
Faster Binary Embeddings for Preserving Euclidean Distances	Oct 1, 2020	Quantization	CodeCode Available	0
How LSTM Encodes Syntax: Exploring Context Vectors and Semi-Quantization on Natural Text	Oct 1, 2020	Language ModelingLanguage Modelling	—Unverified	0
Stochastic Precision Ensemble: Self-Knowledge Distillation for Quantized Deep Neural Networks	Sep 30, 2020	image-classificationImage Classification	—Unverified	0

Show:10 25 50

← PrevPage 148 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified