Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4101–4150 of 4925 papers

Title	Date	Tasks	Status
AddNet: Deep Neural Networks Using FPGA-Optimized Multipliers	Nov 19, 2019	Quantization	—Unverified
CoopNet: Cooperative Convolutional Neural Network for Low-Power MCUs	Nov 19, 2019	BinarizationQuantization	CodeCode Available
vqSGD: Vector Quantized Stochastic Gradient Descent	Nov 18, 2019	Distributed OptimizationQuantization	—Unverified
Efficient Hardware Implementation of Incremental Learning and Inference on Chip	Nov 18, 2019	CPUIncremental Learning	—Unverified
Transductive Zero-Shot Hashing for Multilabel Image Retrieval	Nov 17, 2019	Image RetrievalMulti-Label Image Retrieval	CodeCode Available
Loss Aware Post-training Quantization	Nov 17, 2019	Quantization	CodeCode Available
Data Efficient Stagewise Knowledge Distillation	Nov 15, 2019	Knowledge DistillationModel Compression	CodeCode Available
One-Bit Sigma-Delta modulation on the circle	Nov 14, 2019	Quantization	—Unverified
The Canonical Distortion Measure for Vector Quantization and Function Approximation	Nov 14, 2019	Quantization	—Unverified
DupNet: Towards Very Tiny Quantized CNN with Improved Accuracy for Face Detection	Nov 13, 2019	Face DetectionQuantization	—Unverified
What Do Compressed Deep Neural Networks Forget?	Nov 13, 2019	FairnessInterpretability Techniques for Deep Learning	CodeCode Available
Quantization-based Bermudan option pricing in the FX world	Nov 13, 2019	Quantization	—Unverified
Hyper-Sphere Quantization: Communication-Efficient SGD for Federated Learning	Nov 12, 2019	Federated LearningQuantization	CodeCode Available
Norm-Explicit Quantization: Improving Vector Quantization for Maximum Inner Product Search	Nov 12, 2019	Data CompressionQuantization	CodeCode Available
Iteratively Training Look-Up Tables for Network Quantization	Nov 12, 2019	Network PruningQuantization	—Unverified
Multiple yield curve modelling with CBI processes	Nov 7, 2019	Quantization	—Unverified
A Programmable Approach to Neural Network Compression	Nov 6, 2019	Bayesian OptimizationImage Classification	CodeCode Available
Post-Training 4-bit Quantization on Embedding Tables	Nov 5, 2019	QuantizationRecommendation Systems	—Unverified
Ternary MobileNets via Per-Layer Hybrid Filter Banks	Nov 4, 2019	Quantization	—Unverified
Comprehensive SNN Compression Using ADMM Optimization and Activity Regularization	Nov 3, 2019	Model CompressionQuantization	CodeCode Available
Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers	Nov 1, 2019	Image ClassificationMachine Translation	—Unverified
LFZip: Lossy compression of multivariate floating-point time series data via improved prediction	Nov 1, 2019	Data CompressionQuantization	CodeCode Available
Memory Requirement Reduction of Deep Neural Networks Using Low-bit Quantization of Parameters	Nov 1, 2019	QuantizationSpeech Enhancement	—Unverified
MulCode: A Multiplicative Multi-way Model for Compressing Neural Language Model	Nov 1, 2019	Language ModelingLanguage Modelling	—Unverified
On Distributed Quantization for Classification	Nov 1, 2019	ClassificationGeneral Classification	—Unverified
On Neural Architecture Search for Resource-Constrained Hardware Platforms	Oct 31, 2019	Neural Architecture SearchQuantization	—Unverified
SPARQ-SGD: Event-Triggered and Compressed Communication in Decentralized Stochastic Optimization	Oct 31, 2019	QuantizationStochastic Optimization	—Unverified
Channel Estimation for MIMO Hybrid Architectures with Low Resolution ADCs for mmWave Communication	Oct 30, 2019	Quantization	—Unverified
Exploiting Intelligent Reflecting Surfaces in NOMA Networks: Joint Beamforming Optimization	Oct 30, 2019	Quantization	—Unverified
Training DNN IoT Applications for Deployment On Analog NVM Crossbars	Oct 30, 2019	Quantization	—Unverified
Integrating PHY Security Into NDN-IoT Networks By Exploiting MEC: Authentication Efficiency, Robustness, and Accuracy Enhancement	Oct 29, 2019	Decision MakingEdge-computing	—Unverified
Noiseless Privacy	Oct 29, 2019	Privacy PreservingQuantization	—Unverified
Towards Unsupervised Speech Recognition and Synthesis with Quantized Speech Representation Learning	Oct 28, 2019	ClusteringPhoneme Recognition	—Unverified
Secure Evaluation of Quantized Neural Networks	Oct 28, 2019	Image ClassificationQuantization	—Unverified
Asynchronous Decentralized SGD with Quantized and Local Updates	Oct 27, 2019	BlockingDistributed Optimization	—Unverified
Q-GADMM: Quantized Group ADMM for Communication Efficient Decentralized Machine Learning	Oct 23, 2019	BIG-bench Machine Learningimage-classification	—Unverified
CNN-based Analog CSI Feedback in FDD MIMO-OFDM Systems	Oct 23, 2019	DiversityQuantization	—Unverified
A Binary Variational Autoencoder for Hashing	Oct 22, 2019	QuantizationRetrieval	CodeCode Available
Image processing in DNA	Oct 22, 2019	Image InpaintingQuantization	—Unverified
Mirror Descent View for Neural Network Quantization	Oct 18, 2019	Quantizationvalid	CodeCode Available
Fully Quantized Transformer for Machine Translation	Oct 17, 2019	Machine TranslationQuantization	—Unverified
Reinforced Bit Allocation under Task-Driven Semantic Distortion Metrics	Oct 16, 2019	General ClassificationQuantization	—Unverified
Variation-aware Binarized Memristive Networks	Oct 14, 2019	Quantization	—Unverified
Parametric context adaptive Laplace distribution for multimedia compression	Oct 14, 2019	Data CompressionQuantization	—Unverified
Automatic Neural Network Compression by Sparsity-Quantization Joint Learning: A Constrained Optimization-based Approach	Oct 14, 2019	Neural Network CompressionQuantization	CodeCode Available
OverQ: Opportunistic Outlier Quantization for Neural Network Accelerators	Oct 13, 2019	Quantization	—Unverified
High-Dimensional Stochastic Gradient Quantization for Communication-Efficient Edge Learning	Oct 9, 2019	Federated LearningQuantization	—Unverified
QPyTorch: A Low-Precision Arithmetic Simulation Framework	Oct 9, 2019	Quantization	CodeCode Available
Bit Efficient Quantization for Deep Neural Networks	Oct 7, 2019	ClusteringQuantization	—Unverified
REMIND Your Neural Network to Prevent Catastrophic Forgetting	Oct 6, 2019	QuantizationQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 83 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified