Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3101–3125 of 4925 papers

Title	Date	Tasks	Status	Hype
Predicting Attention Sparsity in Transformers	Nov 16, 2021	DecoderLanguage Modeling	—Unverified	0
Wyner-Ziv Gradient Compression for Federated Learning	Nov 16, 2021	Federated LearningQuantization	—Unverified	0
Online Meta Adaptation for Variable-Rate Learned Image Compression	Nov 16, 2021	DecoderImage Compression	—Unverified	0
Machine Learning for CSI Recreation Based on Prior Knowledge	Nov 15, 2021	BIG-bench Machine LearningQuantization	—Unverified	0
On the Tradeoff between Energy, Precision, and Accuracy in Federated Quantized Neural Networks	Nov 15, 2021	Federated LearningQuantization	—Unverified	0
Energy Efficient Learning with Low Resolution Stochastic Domain Wall Synapse Based Deep Neural Networks	Nov 14, 2021	Quantization	—Unverified	0
Iterative Training: Finding Binary Weight Deep Neural Networks with Layer Binarization	Nov 13, 2021	BinarizationQuantization	CodeCode Available	0
Domain Generalization on Efficient Acoustic Scene Classification using Residual Normalization	Nov 12, 2021	Acoustic Scene ClassificationClassification	—Unverified	0
Q-Learning for MDPs with General Spaces: Convergence and Near Optimality via Quantization under Weak Continuity	Nov 12, 2021	Q-LearningQuantization	—Unverified	0
A Robust Deep Learning-Based Beamforming Design for RIS-assisted Multiuser MISO Communications with Practical Constraints	Nov 12, 2021	Quantization	—Unverified	0
Variability-Aware Training and Self-Tuning of Highly Quantized DNNs for Analog PIM	Nov 11, 2021	Quantization	—Unverified	0
Solving Multi-Arm Bandit Using a Few Bits of Communication	Nov 11, 2021	Active LearningQuantization	—Unverified	0
An Underexplored Dilemma between Confidence and Calibration in Quantized Neural Networks	Nov 10, 2021	Decision MakingQuantization	CodeCode Available	0
Entropy optimized semi-supervised decomposed vector-quantized variational autoencoder model based on transfer learning for multiclass text classification and generation	Nov 10, 2021	DecoderMulti Class Text Classification	—Unverified	0
Prune Once for All: Sparse Pre-Trained Language Models	Nov 10, 2021	AllNatural Language Inference	—Unverified	0
Graph-Based Depth Denoising & Dequantization for Point Cloud Enhancement	Nov 9, 2021	DenoisingGraph Learning	—Unverified	0
Learning from Multiple Time Series: A Deep Disentangled Approach to Diversified Time Series Forecasting	Nov 9, 2021	DecoderQuantization	—Unverified	0
Differential Modulation in Massive MIMO With Low-Resolution ADCs	Nov 9, 2021	Quantization	—Unverified	0
ML-EXray: Visibility into ML Deployment on the Edge	Nov 8, 2021	Quantization	—Unverified	0
Rethinking Deconvolution for 2D Human Pose Estimation Light yet Accurate Model for Real-time Edge Computing	Nov 8, 2021	2D Human Pose EstimationDecoder	—Unverified	0
LiMuSE: Lightweight Multi-modal Speaker Extraction	Nov 7, 2021	Model CompressionQuantization	CodeCode Available	1
MQBench: Towards Reproducible and Deployable Model Quantization Benchmark	Nov 5, 2021	CPUGPU	CodeCode Available	1
LW-GCN: A Lightweight FPGA-based Graph Convolutional Network Accelerator	Nov 4, 2021	CPUGPU	—Unverified	0
Qimera: Data-free Quantization with Synthetic Boundary Supporting Samples	Nov 4, 2021	Data Free QuantizationDisentanglement	CodeCode Available	1
Constructing High-Order Signed Distance Maps from Computed Tomography Data with Application to Bone Morphometry	Nov 2, 2021	Quantization	—Unverified	0

Show:10 25 50

← PrevPage 125 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified