Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4051–4100 of 4925 papers

Title	Date	Tasks	Status
Embedding Compression with Isotropic Iterative Quantization	Jan 11, 2020	Image RetrievalQuantization	—Unverified
Gaussian Approximation of Quantization Error for Estimation from Compressed Data	Jan 9, 2020	compressed sensingQuantization	—Unverified
Resource-Efficient Neural Networks for Embedded Systems	Jan 7, 2020	Autonomous NavigationBIG-bench Machine Learning	—Unverified
RPR: Random Partition Relaxation for Training; Binary and Ternary Weight Neural Networks	Jan 4, 2020	Quantization	—Unverified
Attention based on-device streaming speech recognition with large speech corpus	Jan 2, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Don't Waste Your Bits! Squeeze Activations and Gradients for Deep Neural Networks via TinyScript	Jan 1, 2020	Quantization	—Unverified
Acceleration for Compressed Gradient Descent in Distributed Optimization	Jan 1, 2020	Distributed OptimizationFederated Learning	—Unverified
Train Big, Then Compress: Rethinking Model Size for Efficient Training and Inference of Transformers	Jan 1, 2020	Machine TranslationQuantization	—Unverified
Differentiable Product Quantization for Learning Compact Embedding Layers	Jan 1, 2020	Quantization	—Unverified
Efficient Systolic Array Based on Decomposable MAC for Quantized Deep Neural Networks	Jan 1, 2020	Quantization	—Unverified
New Loss Functions for Fast Maximum Inner Product Search	Jan 1, 2020	BenchmarkingQuantization	—Unverified
Mixed-Precision Quantized Neural Network with Progressively Decreasing Bitwidth For Image Classification and Object Detection	Dec 29, 2019	General Classificationimage-classification	—Unverified
Towards Unified INT8 Training for Convolutional Neural Network	Dec 29, 2019	GPUobject-detection	—Unverified
AdaBits: Neural Network Quantization with Adaptive Bit-Widths	Dec 20, 2019	Quantization	CodeCode Available
EAST: Encoding-Aware Sparse Training for Deep Memory Compression of ConvNets	Dec 20, 2019	Quantization	CodeCode Available
FQ-Conv: Fully Quantized Convolution for Efficient and Accurate Inference	Dec 19, 2019	Quantization	—Unverified
Interleaved Composite Quantization for High-Dimensional Similarity Search	Dec 18, 2019	QuantizationVocal Bursts Intensity Prediction	—Unverified
Adaptive Loss-aware Quantization for Multi-bit Networks	Dec 18, 2019	Quantization	CodeCode Available
Neural Networks Weights Quantization: Target None-retraining Ternary (TNT)	Dec 18, 2019	Quantization	—Unverified
Efficient Error-Tolerant Quantized Neural Network Accelerators	Dec 16, 2019	QuantizationScheduling	—Unverified
Attention network forecasts time-to-failure in laboratory shear experiments	Dec 12, 2019	ClusteringGeneral Classification	—Unverified
Learned Variable-Rate Image Compression with Residual Divisive Normalization	Dec 11, 2019	DecoderImage Compression	—Unverified
Maximum Average Entropy-Based Quantization of Local Observations for Distributed Detection	Dec 10, 2019	Quantization	—Unverified
Compressing 3DCNNs Based on Tensor Train Decomposition	Dec 8, 2019	Hand Gesture RecognitionHand-Gesture Recognition	—Unverified
Tensor Recovery from Noisy and Multi-Level Quantized Measurements	Dec 5, 2019	Quantization	—Unverified
RTN: Reparameterized Ternary Network	Dec 4, 2019	Quantization	—Unverified
Deep Model Compression Via Two-Stage Deep Reinforcement Learning	Dec 4, 2019	Autonomous DrivingDeep Reinforcement Learning	—Unverified
EDAS: Efficient and Differentiable Architecture Search	Dec 3, 2019	GPUNeural Architecture Search	—Unverified
Optimizing the energy consumption of spiking neural networks for neuromorphic applications	Dec 3, 2019	Quantization	CodeCode Available
Coresets for Archetypal Analysis	Dec 1, 2019	Quantization	CodeCode Available
Generalization Error Analysis of Quantized Compressive Learning	Dec 1, 2019	Quantization	—Unverified
Error Correcting Output Codes Improve Probability Estimation and Adversarial Robustness of Deep Neural Networks	Dec 1, 2019	Adversarial DefenseAdversarial Robustness	CodeCode Available
Post training 4-bit quantization of convolutional networks for rapid-deployment	Dec 1, 2019	Quantization	CodeCode Available
Normalization Helps Training of Quantized LSTM	Dec 1, 2019	Quantization	CodeCode Available
The Synthesis of XNOR Recurrent Neural Networks with Stochastic Logic	Dec 1, 2019	Quantization	—Unverified
Random Projections with Asymmetric Quantization	Dec 1, 2019	Data CompressionQuantization	—Unverified
Qsparse-local-SGD: Distributed SGD with Quantization, Sparsification and Local Computations	Dec 1, 2019	Distributed OptimizationQuantization	CodeCode Available
A binary-activation, multi-level weight RNN and training algorithm for ADC-/DAC-free and noise-resilient processing-in-memory inference with eNVM	Nov 30, 2019	Quantization	—Unverified
Semi-Relaxed Quantization with DropBits: Training Low-Bit Neural Networks via Bit-wise Regularization	Nov 29, 2019	Quantization	—Unverified
QKD: Quantization-aware Knowledge Distillation	Nov 28, 2019	Knowledge DistillationQuantization	—Unverified
Neural Network-Inspired Analog-to-Digital Conversion to Achieve Super-Resolution with Low-Precision RRAM Devices	Nov 28, 2019	QuantizationRobust Design	—Unverified
Music Source Separation in the Waveform Domain	Nov 27, 2019	Audio GenerationAudio Synthesis	—Unverified
Two-Stage Learning for Uplink Channel Estimation in One-Bit Massive MIMO	Nov 27, 2019	Deep LearningDenoising	—Unverified
Model-Aware Deep Architectures for One-Bit Compressive Variational Autoencoding	Nov 27, 2019	Compressive SensingQuantization	CodeCode Available
Pyramid Vector Quantization and Bit Level Sparsity in Weights for Efficient Neural Networks Inference	Nov 24, 2019	Quantization	—Unverified
A SOT-MRAM-based Processing-In-Memory Engine for Highly Compressed DNN Implementation	Nov 24, 2019	Model CompressionQuantization	—Unverified
Quantization Networks	Nov 21, 2019	image-classificationImage Classification	CodeCode Available
Learning Hierarchical Discrete Linguistic Units from Visually-Grounded Speech	Nov 21, 2019	Image RetrievalQuantization	—Unverified
IFQ-Net: Integrated Fixed-point Quantization Networks for Embedded Vision	Nov 19, 2019	Face DetectionImage Classification	—Unverified
On the Discrepancy between the Theoretical Analysis and Practical Implementations of Compressed Communication for Distributed Deep Learning	Nov 19, 2019	Model CompressionQuantization	CodeCode Available

Show:10 25 50

← PrevPage 82 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified