Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3651–3700 of 4925 papers

Title	Date	Tasks	Status	Hype
A Linearly Convergent Algorithm for Decentralized Optimization: Sending Less Bits for Free!	Nov 3, 2020	Quantization	—Unverified	0
Analytical aspects of non-differentiable neural networks	Nov 3, 2020	Quantization	—Unverified	0
High Performance Natural Language Processing	Nov 1, 2020	Knowledge DistillationQuantization	—Unverified	0
A Greedy Bit-flip Training Algorithm for Binarized Knowledge Graph Embeddings	Nov 1, 2020	Graph EmbeddingKnowledge Graph Completion	—Unverified	0
Short Text Topic Modeling with Topic Distribution Quantization and Negative Sampling Decoder	Nov 1, 2020	DecoderQuantization	CodeCode Available	1
Time regularization as a solution to mitigate quantization induced performance degradation	Oct 30, 2020	Quantization	—Unverified	0
One-Bit Direct Position Determination of Narrowband Gaussian Signals	Oct 29, 2020	PositionQuantization	—Unverified	0
A Greedy Algorithm for Quantizing Neural Networks	Oct 29, 2020	Quantization	CodeCode Available	1
Accordion: Adaptive Gradient Communication via Critical Learning Regime Identification	Oct 29, 2020	Quantization	CodeCode Available	1
Permute, Quantize, and Fine-tune: Efficient Compression of Neural Networks	Oct 29, 2020	image-classificationImage Classification	CodeCode Available	1
Enhanced Blind Calibration of Uniform Linear Arrays with One-Bit Quantization by Kullback-Leibler Divergence Covariance Fitting	Oct 28, 2020	Quantization	—Unverified	0
Diagnostic data integration using deep neural networks for real-time plasma analysis	Oct 28, 2020	Data IntegrationDiagnostic	—Unverified	0
INT8 Winograd Acceleration for Conv1D Equipped ASR Models Deployed on Mobile Devices	Oct 28, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Full-Duplex Cell-Free mMIMO Systems: Analysis and Decentralized Optimization	Oct 27, 2020	Quantization	—Unverified	0
FD Cell-Free mMIMO: Analysis and Optimization	Oct 27, 2020	Quantization	—Unverified	0
A Statistical Framework for Low-bitwidth Training of Deep Neural Networks	Oct 27, 2020	Linguistic AcceptabilityNatural Language Inference	CodeCode Available	1
A QP-adaptive Mechanism for CNN-based Filter in Video Coding	Oct 25, 2020	Quantization	—Unverified	0
MARS: Multi-macro Architecture SRAM CIM-Based Accelerator with Co-designed Compressed Neural Networks	Oct 24, 2020	Model CompressionNetwork Pruning	—Unverified	0
ShiftAddNet: A Hardware-Inspired Deep Network	Oct 24, 2020	Quantization	CodeCode Available	1
Millimeter Wave MIMO Channel Estimation with 1-bit Spatial Sigma-delta Analog-to-Digital Converters	Oct 23, 2020	Quantization	—Unverified	0
Linearly Converging Error Compensated SGD	Oct 23, 2020	Quantization	CodeCode Available	0
Adaptive Gradient Quantization for Data-Parallel SGD	Oct 23, 2020	Quantization	CodeCode Available	1
On Resource-Efficient Bayesian Network Classifiers and Deep Neural Networks	Oct 22, 2020	Quantization	CodeCode Available	0
Recovery of sparse linear classifiers from mixture of responses	Oct 22, 2020	compressed sensingQuantization	—Unverified	0
Mixed-Precision Embedding Using a Cache	Oct 21, 2020	GPUQuantization	—Unverified	0
Comparing Fisher Information Regularization with Distillation for DNN Quantization	Oct 19, 2020	Knowledge DistillationQuantization	—Unverified	0
Robustness-aware 2-bit quantization with real-time performance for neural network	Oct 19, 2020	Generative Adversarial NetworkQuantization	—Unverified	0
FTBNN: Rethinking Non-linearity for 1-bit CNNs and Going Beyond	Oct 19, 2020	Image ClassificationQuantization	CodeCode Available	0
Check-N-Run: A Checkpointing System for Training Deep Learning Recommendation Models	Oct 17, 2020	QuantizationRecommendation Systems	—Unverified	0
CQ-VAE: Coordinate Quantized VAE for Uncertainty Estimation with Application to Disk Shape Analysis from Lumbar Spine MRI Images	Oct 17, 2020	Quantization	—Unverified	0
Volumetric Calculation of Quantization Error in 3-D Vision Systems	Oct 16, 2020	Quantization	—Unverified	0
Federated Learning in Adversarial Settings	Oct 15, 2020	Federated LearningQuantization	—Unverified	0
FPRaker: A Processing Element For Accelerating Neural Network Training	Oct 15, 2020	Quantization	—Unverified	0
Towards Accurate Quantization and Pruning via Data-free Knowledge Transfer	Oct 14, 2020	Data Free QuantizationQuantization	—Unverified	0
An Investigation on Different Underlying Quantization Schemes for Pre-trained Language Models	Oct 14, 2020	ClusteringQuantization	—Unverified	0
Enhancement Of Coded Speech Using a Mask-Based Post-Filter	Oct 12, 2020	DecoderQuantization	—Unverified	0
Real-time Mask Detection on Google Edge TPU	Oct 9, 2020	Quantization	—Unverified	0
Once Quantization-Aware Training: High Performance Extremely Low-bit Architecture Search	Oct 9, 2020	Neural Architecture SearchQuantization	CodeCode Available	1
3DMolNet: A Generative Network for Molecular Structures	Oct 8, 2020	QuantizationTranslation	—Unverified	0
AxFormer: Accuracy-driven Approximation of Transformers for Faster, Smaller and more Accurate NLP Models	Oct 7, 2020	Hard AttentionQuantization	CodeCode Available	0
Optimal Gradient Compression for Distributed and Federated Learning	Oct 7, 2020	Federated LearningQuantization	—Unverified	0
Characterising Bias in Compressed Models	Oct 6, 2020	FairnessQuantization	—Unverified	0
Joint Pruning & Quantization for Extremely Sparse Neural Networks	Oct 5, 2020	Depth EstimationQuantization	—Unverified	0
Sparse Quantized Spectral Clustering	Oct 3, 2020	ClusteringQuantization	—Unverified	0
GECKO: Reconciling Privacy, Accuracy and Efficiency in Embedded Deep Learning	Oct 2, 2020	Deep LearningModel Compression	—Unverified	0
Compress Polyphone Pronunciation Prediction Model with Shared Labels	Oct 1, 2020	PredictionQuantization	—Unverified	0
BiLiMO: Bit-Limited MIMO Radar via Task-Based Quantization	Oct 1, 2020	Quantization	—Unverified	0
Faster Binary Embeddings for Preserving Euclidean Distances	Oct 1, 2020	Quantization	CodeCode Available	0
How LSTM Encodes Syntax: Exploring Context Vectors and Semi-Quantization on Natural Text	Oct 1, 2020	Language ModelingLanguage Modelling	—Unverified	0
Stochastic Precision Ensemble: Self-Knowledge Distillation for Quantized Deep Neural Networks	Sep 30, 2020	image-classificationImage Classification	—Unverified	0

Show:10 25 50

← PrevPage 74 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified