Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4351–4400 of 4925 papers

Title	Date	Tasks	Status	Hype
Cluster Regularized Quantization for Deep Networks Compression	Feb 27, 2019	Quantization	—Unverified	0
Learned Step Size Quantization	Feb 21, 2019	Model CompressionQuantization	CodeCode Available	1
Novel Near-Optimal Scalar Quantizers with Exponential Decay Rate and Global Convergence	Feb 18, 2019	Quantization	—Unverified	0
Low-bit Quantization of Neural Networks for Efficient Inference	Feb 18, 2019	Quantization	CodeCode Available	0
Quantized Frank-Wolfe: Faster Optimization, Lower Communication, and Projection Free	Feb 17, 2019	Distributed OptimizationQuantization	—Unverified	0
AutoQ: Automated Kernel-Wise Neural Network Quantization	Feb 15, 2019	AutoMLDeep Reinforcement Learning	—Unverified	0
Model Compression with Adversarial Robustness: A Unified Optimization Framework	Feb 10, 2019	Adversarial RobustnessModel Compression	CodeCode Available	0
Binarized Knowledge Graph Embeddings	Feb 8, 2019	Knowledge Graph CompletionKnowledge Graph Embeddings	CodeCode Available	0
FSNet: Compression of Deep Convolutional Neural Networks by Filter Summary	Feb 8, 2019	General Classificationimage-classification	—Unverified	0
Compression of Recurrent Neural Networks for Efficient Language Modeling	Feb 6, 2019	Language ModelingLanguage Modelling	—Unverified	0
Same, Same But Different - Recovering Neural Network Quantization Error Through Weight Factorization	Feb 5, 2019	Network PruningQuantization	CodeCode Available	0
Supervised Quantization for Similarity Search	Feb 2, 2019	feature selectionGeneral Classification	—Unverified	0
Collaborative Quantization for Cross-Modal Similarity Search	Feb 2, 2019	Quantization	—Unverified	0
Efficient Hybrid Network Architectures for Extremely Quantized Neural Networks Enabling Intelligence at the Edge	Feb 1, 2019	Edge-computingQuantization	—Unverified	0
Robustness of Generalized Learning Vector Quantization Models against Adversarial Attacks	Feb 1, 2019	Quantization	CodeCode Available	0
Deep Triplet Quantization	Feb 1, 2019	Deep HashingImage Retrieval	CodeCode Available	0
Model-Based Detector for SSDs in the Presence of Inter-cell Interference	Jan 31, 2019	DecoderQuantization	—Unverified	0
Improving Neural Network Quantization without Retraining using Outlier Channel Splitting	Jan 28, 2019	Language ModelingLanguage Modelling	CodeCode Available	0
Distributed Learning with Compressed Gradient Differences	Jan 26, 2019	Distributed ComputingQuantization	—Unverified	0
Subspace Robust Wasserstein Distances	Jan 25, 2019	Quantization	—Unverified	0
QGAN: Quantized Generative Adversarial Networks	Jan 24, 2019	Quantization	—Unverified	0
Nonparametric Inference under B-bits Quantization	Jan 24, 2019	Quantization	—Unverified	0
Learning Space Partitions for Nearest Neighbor Search	Jan 24, 2019	General Classificationgraph partitioning	CodeCode Available	0
Toward Joint Image Generation and Compression using Generative Adversarial Networks	Jan 23, 2019	Generative Adversarial NetworkImage Compression	—Unverified	0
On the Uplink Achievable Rate of Massive MIMO System With Low-Resolution ADC and RF Impairments	Jan 22, 2019	Quantization	—Unverified	0
Hybrid coarse-fine classification for head pose estimation	Jan 21, 2019	3D ReconstructionClassification	CodeCode Available	0
Foothill: A Quasiconvex Regularization for Edge Computing of Deep Neural Networks	Jan 18, 2019	Edge-computingGeneral Classification	—Unverified	0
Activation Functions for Generalized Learning Vector Quantization - A Performance Comparison	Jan 17, 2019	ClassificationGeneral Classification	—Unverified	0
Mean Estimation from One-Bit Measurements	Jan 10, 2019	Quantization	—Unverified	0
Quantized Epoch-SGD for Communication-Efficient Distributed Learning	Jan 10, 2019	Quantization	—Unverified	0
GIF2Video: Color Dequantization and Temporal Interpolation of GIF images	Jan 9, 2019	Quantization	—Unverified	0
DSConv: Efficient Convolution Operator	Jan 7, 2019	Quantization	CodeCode Available	0
Dataflow-based Joint Quantization of Weights and Activations for Deep Neural Networks	Jan 4, 2019	Quantization	—Unverified	0
Machine Learning at the Wireless Edge: Distributed Stochastic Gradient Descent Over-the-Air	Jan 3, 2019	BIG-bench Machine LearningQuantization	CodeCode Available	0
Vector and Line Quantization for Billion-scale Similarity Search on GPUs	Jan 2, 2019	CPUGPU	CodeCode Available	0
ADMM-NN: An Algorithm-Hardware Co-Design Framework of DNNs Using Alternating Direction Method of Multipliers	Dec 31, 2018	Model CompressionQuantization	CodeCode Available	1
Per-Tensor Fixed-Point Quantization of the Back-Propagation Algorithm	Dec 31, 2018	Quantization	—Unverified	0
Interest Point Detection based on Adaptive Ternary Coding	Dec 31, 2018	Face RecognitionInterest Point Detection	—Unverified	0
Quantized Guided Pruning for Efficient Hardware Implementations of Convolutional Neural Networks	Dec 29, 2018	Quantization	—Unverified	0
End-to-End Latent Fingerprint Search	Dec 26, 2018	Quantization	—Unverified	0
Precision Highway for Ultra Low-Precision Quantization	Dec 24, 2018	Language ModelingLanguage Modelling	—Unverified	0
Artificial neural networks condensation: A strategy to facilitate adaption of machine learning in medical settings by reducing computational burden	Dec 23, 2018	Computational EfficiencyMortality Prediction	—Unverified	0
Quicker ADC : Unlocking the hidden potential of Product Quantization with SIMD	Dec 21, 2018	QuantizationRetrieval	CodeCode Available	0
SQuantizer: Simultaneous Learning for Both Sparse and Low-precision Neural Networks	Dec 20, 2018	Machine TranslationNeural Architecture Search	—Unverified	0
Fast Adjustable Threshold For Uniform Neural Network Quantization (Winning solution of LPIRC-II)	Dec 19, 2018	Quantization	CodeCode Available	0
Efficient Super Resolution Using Binarized Neural Network	Dec 16, 2018	Binarizationimage-classification	—Unverified	0
Auto-tuning Neural Network Quantization Framework for Collaborative Inference Between the Cloud and Edge	Dec 16, 2018	Collaborative InferenceQuantization	—Unverified	0
Deep neural networks algorithms for stochastic control problems on finite horizon: numerical applications	Dec 13, 2018	ManagementQuantization	—Unverified	0
Exploring Embedding Methods in Binary Hyperdimensional Computing: A Case Study for Motor-Imagery based Brain-Computer Interfaces	Dec 13, 2018	Brain Computer InterfaceEEG	CodeCode Available	0
E-RNN: Design Optimization for Efficient Recurrent Neural Networks in FPGAs	Dec 12, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0

Show:10 25 50

← PrevPage 88 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified