Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4151–4200 of 4925 papers

Title	Date	Tasks	Status
QuaRL: Quantization for Fast and Environmentally Sustainable Reinforcement Learning	Oct 2, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
Hierarchical Encoding of Sequential Data With Compact and Sub-Linear Storage Cost	Oct 1, 2019	QuantizationSimultaneous Localization and Mapping	CodeCode Available
NGEMM: Optimizing GEMM for Deep Learning via Compiler-based Techniques	Oct 1, 2019	Deep LearningQuantization	—Unverified
DSConv: Efficient Convolution Operator	Oct 1, 2019	Quantization	—Unverified
Automated design of error-resilient and hardware-efficient deep neural networks	Sep 30, 2019	Autonomous VehiclesQuantization	—Unverified
XNOR-Net++: Improved Binary Neural Networks	Sep 30, 2019	BinarizationClassification with Binary Neural Network	—Unverified
Optimal Controller and Quantizer Selection for Partially Observable Linear-Quadratic-Gaussian Systems	Sep 30, 2019	QuantizationScheduling	—Unverified
AdaptivFloat: A Floating-point based Data Type for Resilient Deep Learning Inference	Sep 29, 2019	Quantization	—Unverified
REQ-YOLO: A Resource-Aware, Efficient Quantization Framework for Object Detection on FPGAs	Sep 29, 2019	Model Compressionobject-detection	—Unverified
Additive Powers-of-Two Quantization: An Efficient Non-uniform Discretization for Neural Networks	Sep 28, 2019	Computational EfficiencyQuantization	CodeCode Available
FedPAQ: A Communication-Efficient Federated Learning Method with Periodic Averaging and Quantization	Sep 28, 2019	Federated LearningQuantization	—Unverified
Optimized Quantization in Distributed Graph Signal Filtering	Sep 27, 2019	Quantization	—Unverified
Impact of Low-bitwidth Quantization on the Adversarial Robustness for Embedded Neural Networks	Sep 27, 2019	Adversarial RobustnessBIG-bench Machine Learning	—Unverified
GA-GAN: CT reconstruction from Biplanar DRRs using GAN with Guided Attention	Sep 27, 2019	CT ReconstructionQuantization	—Unverified
Optimizing Speech Recognition For The Edge	Sep 26, 2019	Efficient Neural NetworkQuantization	—Unverified
Adaptive Binary-Ternary Quantization	Sep 26, 2019	Autonomous VehiclesImage Classification	—Unverified
Goten: GPU-Outsourcing Trusted Execution of Neural Network Training and Prediction	Sep 25, 2019	GPUPrivacy Preserving	CodeCode Available
Hybrid Weight Representation: A Quantization Method Represented with Ternary and Sparse-Large Weights	Sep 25, 2019	Quantization	—Unverified
QGAN: Quantize Generative Adversarial Networks to Extreme low-bits	Sep 25, 2019	Quantization	—Unverified
Rethinking Neural Network Quantization	Sep 25, 2019	Quantization	—Unverified
Prune or quantize? Strategy for Pareto-optimally low-cost and accurate CNN	Sep 25, 2019	CPUGPU	—Unverified
Provably Communication-efficient Data-parallel SGD via Nonuniform Quantization	Sep 25, 2019	Quantization	—Unverified
Smart Ternary Quantization	Sep 25, 2019	image-classificationImage Classification	—Unverified
Lattice Representation Learning	Sep 25, 2019	DecoderQuantization	—Unverified
CURSOR-BASED ADAPTIVE QUANTIZATION FOR DEEP NEURAL NETWORK	Sep 25, 2019	Quantization	—Unverified
Learning Compact Embedding Layers via Differentiable Product Quantization	Sep 25, 2019	Quantization	—Unverified
Compression without Quantization	Sep 25, 2019	DecoderImage Compression	—Unverified
Learning to Seek: Autonomous Source Seeking with Deep Reinforcement Learning Onboard a Nano Drone Microcontroller	Sep 25, 2019	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available
CAT: Compression-Aware Training for bandwidth reduction	Sep 25, 2019	Quantization	CodeCode Available
Low Rank Training of Deep Neural Networks for Emerging Memory Technology	Sep 25, 2019	Computational EfficiencyDecision Making	—Unverified
Towards Effective 2-bit Quantization: Pareto-optimal Bit Allocation for Deep CNNs Compression	Sep 25, 2019	Quantization	—Unverified
OPTIMAL BINARY QUANTIZATION FOR DEEP NEURAL NETWORKS	Sep 25, 2019	Quantization	—Unverified
On the Pareto Efficiency of Quantized CNN	Sep 25, 2019	Gesture RecognitionQuantization	—Unverified
Online Learned Continual Compression with Stacked Quantization Modules	Sep 25, 2019	Continual LearningQuantization	—Unverified
Monte Carlo Deep Neural Network Arithmetic	Sep 25, 2019	image-classificationImage Classification	—Unverified
Network Pruning for Low-Rank Binary Index	Sep 25, 2019	Model CompressionNetwork Pruning	—Unverified
GQ-Net: Training Quantization-Friendly Deep Networks	Sep 25, 2019	Model CompressionQuantization	—Unverified
Forward and Backward Information Retention for Accurate Binary Neural Networks	Sep 24, 2019	BinarizationNeural Network Compression	CodeCode Available
Autoencoder-Based Error Correction Coding for One-Bit Quantization	Sep 24, 2019	Quantization	—Unverified
A System-Level Solution for Low-Power Object Detection	Sep 24, 2019	CPUObject	—Unverified
Gridless Angular Domain Channel Estimation for mmWave Massive MIMO System With One-Bit Quantization Via Approximate Message Passing	Sep 23, 2019	compressed sensingQuantization	—Unverified
Structured Binary Neural Networks for Image Recognition	Sep 22, 2019	object-detectionObject Detection	—Unverified
HAWKEYE: Adversarial Example Detector for Deep Neural Networks	Sep 22, 2019	Quantization	—Unverified
How to design a derivatives market?	Sep 19, 2019	Quantization	—Unverified
Performance Analysis of Massive MIMO Multi-Way Relay Networks with Low-Resolution ADCs	Sep 19, 2019	Quantization	—Unverified
How Does Batch Normalization Help Binary Training?	Sep 18, 2019	Quantization	—Unverified
Fast Large-Scale Discrete Optimization Based on Principal Coordinate Descent	Sep 16, 2019	Quantization	—Unverified
An Empirical Study towards Characterizing Deep Learning Development and Deployment across Different Frameworks and Platforms	Sep 15, 2019	Adversarial AttackAdversarial Robustness	—Unverified
DASNet: Dynamic Activation Sparsity for Neural Network Efficiency Improvement	Sep 13, 2019	Quantization	—Unverified
Neural Machine Translation with 4-Bit Precision and Beyond	Sep 13, 2019	Machine TranslationNMT	—Unverified

Show:10 25 50

← PrevPage 84 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified