Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4051–4100 of 4925 papers

Title	Date	Tasks	Status	Hype
Error Correcting Output Codes Improve Probability Estimation and Adversarial Robustness of Deep Neural Networks	Dec 1, 2019	Adversarial DefenseAdversarial Robustness	CodeCode Available	0
Generalization Error Analysis of Quantized Compressive Learning	Dec 1, 2019	Quantization	—Unverified	0
Random Projections with Asymmetric Quantization	Dec 1, 2019	Data CompressionQuantization	—Unverified	0
The Synthesis of XNOR Recurrent Neural Networks with Stochastic Logic	Dec 1, 2019	Quantization	—Unverified	0
MetaQuant: Learning to Quantize by Learning to Penetrate Non-differentiable Quantization	Dec 1, 2019	Quantization	CodeCode Available	1
Coresets for Archetypal Analysis	Dec 1, 2019	Quantization	CodeCode Available	0
Normalization Helps Training of Quantized LSTM	Dec 1, 2019	Quantization	CodeCode Available	0
A binary-activation, multi-level weight RNN and training algorithm for ADC-/DAC-free and noise-resilient processing-in-memory inference with eNVM	Nov 30, 2019	Quantization	—Unverified	0
Semi-Relaxed Quantization with DropBits: Training Low-Bit Neural Networks via Bit-wise Regularization	Nov 29, 2019	Quantization	—Unverified	0
QKD: Quantization-aware Knowledge Distillation	Nov 28, 2019	Knowledge DistillationQuantization	—Unverified	0
Neural Network-Inspired Analog-to-Digital Conversion to Achieve Super-Resolution with Low-Precision RRAM Devices	Nov 28, 2019	QuantizationRobust Design	—Unverified	0
Two-Stage Learning for Uplink Channel Estimation in One-Bit Massive MIMO	Nov 27, 2019	Deep LearningDenoising	—Unverified	0
Model-Aware Deep Architectures for One-Bit Compressive Variational Autoencoding	Nov 27, 2019	Compressive SensingQuantization	CodeCode Available	0
Music Source Separation in the Waveform Domain	Nov 27, 2019	Audio GenerationAudio Synthesis	—Unverified	0
A SOT-MRAM-based Processing-In-Memory Engine for Highly Compressed DNN Implementation	Nov 24, 2019	Model CompressionQuantization	—Unverified	0
Pyramid Vector Quantization and Bit Level Sparsity in Weights for Efficient Neural Networks Inference	Nov 24, 2019	Quantization	—Unverified	0
Quantization Networks	Nov 21, 2019	image-classificationImage Classification	CodeCode Available	0
Learning Hierarchical Discrete Linguistic Units from Visually-Grounded Speech	Nov 21, 2019	Image RetrievalQuantization	—Unverified	0
AddNet: Deep Neural Networks Using FPGA-Optimized Multipliers	Nov 19, 2019	Quantization	—Unverified	0
On the Discrepancy between the Theoretical Analysis and Practical Implementations of Compressed Communication for Distributed Deep Learning	Nov 19, 2019	Model CompressionQuantization	CodeCode Available	0
IFQ-Net: Integrated Fixed-point Quantization Networks for Embedded Vision	Nov 19, 2019	Face DetectionImage Classification	—Unverified	0
Online Learned Continual Compression with Adaptive Quantization Modules	Nov 19, 2019	Continual LearningDecoder	CodeCode Available	1
CoopNet: Cooperative Convolutional Neural Network for Low-Power MCUs	Nov 19, 2019	BinarizationQuantization	CodeCode Available	0
vqSGD: Vector Quantized Stochastic Gradient Descent	Nov 18, 2019	Distributed OptimizationQuantization	—Unverified	0
Efficient Hardware Implementation of Incremental Learning and Inference on Chip	Nov 18, 2019	CPUIncremental Learning	—Unverified	0
Loss Aware Post-training Quantization	Nov 17, 2019	Quantization	CodeCode Available	0
Transductive Zero-Shot Hashing for Multilabel Image Retrieval	Nov 17, 2019	Image RetrievalMulti-Label Image Retrieval	CodeCode Available	0
Data Efficient Stagewise Knowledge Distillation	Nov 15, 2019	Knowledge DistillationModel Compression	CodeCode Available	0
One-Bit Sigma-Delta modulation on the circle	Nov 14, 2019	Quantization	—Unverified	0
The Canonical Distortion Measure for Vector Quantization and Function Approximation	Nov 14, 2019	Quantization	—Unverified	0
Quantization-based Bermudan option pricing in the FX world	Nov 13, 2019	Quantization	—Unverified	0
What Do Compressed Deep Neural Networks Forget?	Nov 13, 2019	FairnessInterpretability Techniques for Deep Learning	CodeCode Available	0
DupNet: Towards Very Tiny Quantized CNN with Improved Accuracy for Face Detection	Nov 13, 2019	Face DetectionQuantization	—Unverified	0
Scientific Image Restoration Anywhere	Nov 12, 2019	CPUDenoising	CodeCode Available	1
Hyper-Sphere Quantization: Communication-Efficient SGD for Federated Learning	Nov 12, 2019	Federated LearningQuantization	CodeCode Available	0
Norm-Explicit Quantization: Improving Vector Quantization for Maximum Inner Product Search	Nov 12, 2019	Data CompressionQuantization	CodeCode Available	0
Iteratively Training Look-Up Tables for Network Quantization	Nov 12, 2019	Network PruningQuantization	—Unverified	0
HAWQ-V2: Hessian Aware trace-Weighted Quantization of Neural Networks	Nov 10, 2019	object-detectionObject Detection	CodeCode Available	1
Effectiveness of self-supervised pre-training for speech recognition	Nov 10, 2019	Language ModellingQuantization	CodeCode Available	1
ConveRT: Efficient and Accurate Conversational Representations from Transformers	Nov 9, 2019	Conversational Response Selectionintent-classification	CodeCode Available	1
Multiple yield curve modelling with CBI processes	Nov 7, 2019	Quantization	—Unverified	0
A Programmable Approach to Neural Network Compression	Nov 6, 2019	Bayesian OptimizationImage Classification	CodeCode Available	0
Post-Training 4-bit Quantization on Embedding Tables	Nov 5, 2019	QuantizationRecommendation Systems	—Unverified	0
Ternary MobileNets via Per-Layer Hybrid Filter Banks	Nov 4, 2019	Quantization	—Unverified	0
Comprehensive SNN Compression Using ADMM Optimization and Activity Regularization	Nov 3, 2019	Model CompressionQuantization	CodeCode Available	0
Memory Requirement Reduction of Deep Neural Networks Using Low-bit Quantization of Parameters	Nov 1, 2019	QuantizationSpeech Enhancement	—Unverified	0
On Distributed Quantization for Classification	Nov 1, 2019	ClassificationGeneral Classification	—Unverified	0
Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers	Nov 1, 2019	Image ClassificationMachine Translation	—Unverified	0
LFZip: Lossy compression of multivariate floating-point time series data via improved prediction	Nov 1, 2019	Data CompressionQuantization	CodeCode Available	0
MulCode: A Multiplicative Multi-way Model for Compressing Neural Language Model	Nov 1, 2019	Language ModelingLanguage Modelling	—Unverified	0

Show:10 25 50

← PrevPage 82 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified