Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3951–4000 of 4925 papers

Title	Date	Tasks	Status	Hype
Probability Weighted Compact Feature for Domain Adaptive Retrieval	Mar 6, 2020	Image RetrievalQuantization	CodeCode Available	1
Cluster Pruning: An Efficient Filter Pruning Method for Edge AI Vision Applications	Mar 5, 2020	CPUGPU	—Unverified	0
Optimizing JPEG Quantization for Classification Networks	Mar 5, 2020	Bayesian OptimizationClassification	—Unverified	0
A Survey on Deep Hashing Methods	Mar 4, 2020	Deep HashingDomain Adaptation	—Unverified	0
VQ-DRAW: A Sequential Discrete VAE	Mar 3, 2020	Quantization	CodeCode Available	1
Phoenix: A Low-Precision Floating-Point Quantization Oriented Architecture for Convolutional Neural Networks	Feb 29, 2020	Quantization	—Unverified	0
WaveQ: Gradient-Based Deep Quantization of Neural Networks through Sinusoidal Adaptive Regularization	Feb 29, 2020	Quantization	—Unverified	0
Image Hashing by Minimizing Discrete Component-wise Wasserstein Distance	Feb 29, 2020	Image RetrievalQuantization	CodeCode Available	0
Automatic Perturbation Analysis for Scalable Certified Robustness and Beyond	Feb 28, 2020	Quantization	CodeCode Available	1
Quantized Neural Network Inference with Precision Batching	Feb 26, 2020	GPULanguage Modeling	—Unverified	0
Moniqua: Modulo Quantized Communication in Decentralized SGD	Feb 26, 2020	Quantization	—Unverified	0
Generalized Product Quantization Network for Semi-supervised Image Retrieval	Feb 26, 2020	Image RetrievalMetric Learning	CodeCode Available	1
Train Large, Then Compress: Rethinking Model Size for Efficient Training and Inference of Transformers	Feb 26, 2020	Machine TranslationQuantization	CodeCode Available	1
Adversarial Attack on Deep Product Quantization Network for Image Retrieval	Feb 26, 2020	Adversarial AttackImage Retrieval	—Unverified	0
Optimal Gradient Quantization Condition for Communication-Efficient Distributed Training	Feb 25, 2020	Quantization	—Unverified	0
Non-Volatile Memory Array Based Quantization- and Noise-Resilient LSTM Neural Networks	Feb 25, 2020	Edge-computingGPU	—Unverified	0
Stochastic-Sign SGD for Federated Learning with Theoretical Guarantees	Feb 25, 2020	Federated Learningparameter estimation	—Unverified	0
Searching for Winograd-aware Quantized Networks	Feb 25, 2020	Neural Architecture SearchQuantization	CodeCode Available	1
OptComNet: Optimized Neural Networks for Low-Complexity Channel Estimation	Feb 24, 2020	Quantization	—Unverified	0
Exploring the Connection Between Binary and Spiking Neural Networks	Feb 24, 2020	BinarizationQuantization	CodeCode Available	1
Revisiting Saliency Metrics: Farthest-Neighbor Area Under Curve	Feb 24, 2020	QuantizationSaliency Detection	CodeCode Available	0
Quantized Decentralized Stochastic Learning over Directed Graphs	Feb 23, 2020	Quantization	—Unverified	0
PoET-BiN: Power Efficient Tiny Binary Neurons	Feb 23, 2020	General Classificationimage-classification	—Unverified	0
New Bounds For Distributed Mean Estimation and Variance Reduction	Feb 21, 2020	Distributed OptimizationQuantization	—Unverified	0
Learning Multi-granular Quantized Embeddings for Large-Vocab Categorical Features in Recommender Systems	Feb 20, 2020	QuantizationRecommendation Systems	—Unverified	0
Post-training Quantization with Multiple Points: Mixed Precision without Mixed Precision	Feb 20, 2020	object-detectionObject Detection	—Unverified	0
Neural Network Compression Framework for fast model inference	Feb 20, 2020	BinarizationCPU	CodeCode Available	2
Uncertainty Principle for Communication Compression in Distributed and Federated Learning and the Search for an Optimal Compressor	Feb 20, 2020	Federated LearningQuantization	—Unverified	0
Hierarchical Quantized Autoencoders	Feb 19, 2020	Image CompressionQuantization	CodeCode Available	1
SYMOG: learning symmetric mixture of Gaussian modes for improved fixed-point quantization	Feb 19, 2020	Quantization	—Unverified	0
Algorithm-hardware Co-design for Deformable Convolution	Feb 19, 2020	image-classificationImage Classification	CodeCode Available	1
Variational Bayesian Quantization	Feb 18, 2020	Image CompressionModel Compression	CodeCode Available	1
Gradient _1 Regularization for Quantization Robustness	Feb 18, 2020	Quantization	—Unverified	0
Robust Quantization: One Model to Rule Them All	Feb 18, 2020	Allmodel	CodeCode Available	1
Learning Architectures for Binary Networks	Feb 17, 2020	Quantization	CodeCode Available	1
Precision Gating: Improving Neural Network Efficiency with Dynamic Dual-Precision Activations	Feb 17, 2020	Quantization	CodeCode Available	1
Realizing a Low-Power Head-Mounted Phase-Only Holographic Display by Light-Weight Compression	Feb 14, 2020	DecoderQuantization	—Unverified	0
BitPruning: Learning Bitlengths for Aggressive and Accurate Quantization	Feb 8, 2020	Quantization	—Unverified	0
Accelerating Deep Learning Inference via Freezing	Feb 7, 2020	Deep LearningQuantization	—Unverified	0
Switchable Precision Neural Networks	Feb 7, 2020	Quantization	—Unverified	0
Generating diverse and natural text-to-speech samples using a quantized fine-grained VAE and auto-regressive prosody prior	Feb 6, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Random VLAD based Deep Hashing for Efficient Image Retrieval	Feb 6, 2020	Deep HashingImage Retrieval	—Unverified	0
Differentially Quantized Gradient Methods	Feb 6, 2020	Distributed OptimizationQuantization	—Unverified	0
Emotion Recognition Using Speaker Cues	Feb 4, 2020	Emotion RecognitionQuantization	—Unverified	0
Widening and Squeezing: Towards Accurate and Efficient QNNs	Feb 3, 2020	Quantization	—Unverified	0
Automatic Pruning for Quantized Neural Networks	Feb 3, 2020	Bayesian OptimizationQuantization	—Unverified	0
SQWA: Stochastic Quantized Weight Averaging for Improving the Generalization Capability of Low-Precision Deep Neural Networks	Feb 2, 2020	Quantization	—Unverified	0
Towards Sharper First-Order Adversary with Quantized Gradients	Feb 1, 2020	Adversarial RobustnessQuantization	CodeCode Available	1
Optimal Controller Synthesis and Dynamic Quantizer Switching for Linear-Quadratic-Gaussian Systems	Jan 31, 2020	Quantization	—Unverified	0
Improving LPCNet-based Text-to-Speech with Linear Prediction-structured Mixture Density Network	Jan 31, 2020	QuantizationSpeech Synthesis	—Unverified	0

Show:10 25 50

← PrevPage 80 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified