Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3801–3850 of 4925 papers

Title	Date	Tasks	Status
Stochastic Precision Ensemble: Self-Knowledge Distillation for Quantized Deep Neural Networks	Sep 30, 2020	image-classificationImage Classification	—Unverified
BAMSProd: A Step towards Generalizing the Adaptive Optimization Methods to Deep Binary Model	Sep 29, 2020	Quantization	—Unverified
Recursive CSI Quantization of Time-Correlated MIMO Channels by Deep Learning Classification	Sep 28, 2020	General ClassificationQuantization	CodeCode Available
On Efficient Constructions of Checkpoints	Sep 28, 2020	Quantization	—Unverified
Once Quantized for All: Progressively Searching for Quantized Compact Models	Sep 28, 2020	AllNeural Architecture Search	—Unverified
TernaryBERT: Distillation-aware Ultra-low Bit BERT	Sep 27, 2020	Knowledge DistillationQuantization	CodeCode Available
Perceptual Video Quality Prediction Emphasizing Chroma Distortions	Sep 24, 2020	PredictionQuantization	—Unverified
A Markovian Model-Driven Deep Learning Framework for Massive MIMO CSI Feedback	Sep 20, 2020	QuantizationScheduling	—Unverified
Probabilistically Sampled and Spectrally Clustered Plant Genotypes using Phenotypic Characteristics	Sep 18, 2020	ClusteringQuantization	—Unverified
Resource Allocation and Dithering of Bayesian Parameter Estimation Using Mixed-Resolution Data	Sep 17, 2020	parameter estimationQuantization	—Unverified
Towards Fully 8-bit Integer Inference for the Transformer Model	Sep 17, 2020	Language ModellingQuantization	—Unverified
Extremely Low Bit Transformer Quantization for On-Device Neural Machine Translation	Sep 16, 2020	Machine TranslationNMT	—Unverified
MSP: An FPGA-Specific Mixed-Scheme, Multi-Precision Deep Neural Network Quantization Framework	Sep 16, 2020	Deep LearningEdge-computing	—Unverified
Approximate spectral clustering using both reference vectors and topology of the network generated by growing neural gas	Sep 15, 2020	ClusteringQuantization	CodeCode Available
Fast Implementation of 4-bit Convolutional Neural Networks for Mobile Devices	Sep 14, 2020	Optical Character Recognition (OCR)Quantization	—Unverified
Communication Efficient Distributed Learning with Censored, Quantized, and Generalized Group ADMM	Sep 14, 2020	Quantization	—Unverified
QuantNet: Learning to Quantize by Learning within Fully Differentiable Framework	Sep 10, 2020	BinarizationImage Classification	—Unverified
On the Orthogonality of Knowledge Distillation with Other Techniques: From an Ensemble Perspective	Sep 9, 2020	Data AugmentationEfficient Neural Network	—Unverified
FleXOR: Trainable Fractional Quantization	Sep 9, 2020	Quantization	—Unverified
Alternating Direction Method of Multipliers for Quantization	Sep 8, 2020	Quantization	—Unverified
ECG Beats Fast Classification Base on Sparse Dictionaries	Sep 8, 2020	ClassificationDictionary Learning	CodeCode Available
Algorithm and VLSI Design for 1-bit Data Detection in Massive MIMO-OFDM	Sep 4, 2020	Quantization	CodeCode Available
Deep data compression for approximate ultrasonic image formation	Sep 4, 2020	Data CompressionDecoder	—Unverified
Layer-specific Optimization for Mixed Data Flow with Mixed Precision in FPGA Design for CNN-based Object Detectors	Sep 3, 2020	Bayesian OptimizationModel Compression	—Unverified
Transform Quantization for CNN (Convolutional Neural Network) Compression	Sep 2, 2020	Dimensionality ReductionNeural Network Compression	—Unverified
A new heuristic algorithm for fast k-segmentation	Sep 2, 2020	QuantizationSegmentation	—Unverified
Scaling Up Deep Neural Network Optimization for Edge Inference	Sep 1, 2020	Quantization	—Unverified
Object Detection-Based Variable Quantization Processing	Sep 1, 2020	MS-SSIMObject	—Unverified
An Integrated Approach to Produce Robust Models with High Efficiency	Aug 31, 2020	QuantizationVocal Bursts Intensity Prediction	CodeCode Available
Optimal Quantization for Batch Normalization in Neural Network Deployments and Beyond	Aug 30, 2020	Quantization	—Unverified
An adaptive random experiment design method for engineering experiment	Aug 27, 2020	Experimental DesignQuantization	—Unverified
Stochastic Markov Gradient Descent and Training Low-Bit Neural Networks	Aug 25, 2020	Quantization	—Unverified
Convergence of Federated Learning over a Noisy Downlink	Aug 25, 2020	Federated LearningQuantization	—Unverified
Stochastic Hybrid Combining Design for Quantized Massive MIMO Systems	Aug 24, 2020	QuantizationStochastic Optimization	—Unverified
Lossy Image Compression with Normalizing Flows	Aug 24, 2020	Image CompressionQuantization	—Unverified
One Weight Bitwidth to Rule Them All	Aug 22, 2020	Allimage-classification	—Unverified
Utilizing Explainable AI for Quantization and Pruning of Deep Neural Networks	Aug 20, 2020	Clusteringimage-classification	—Unverified
Training of mixed-signal optical convolutional neural network with reduced quantization level	Aug 20, 2020	Quantization	—Unverified
Channel-wise Hessian Aware trace-Weighted Quantization of Neural Networks	Aug 19, 2020	AutoMLDeep Reinforcement Learning	—Unverified
False Detection (Positives and Negatives) in Object Detection	Aug 16, 2020	Objectobject-detection	—Unverified
ECG beats classification via online sparse dictionary and time pyramid matching	Aug 15, 2020	ClassificationDictionary Learning	CodeCode Available
Weight Equalizing Shift Scaler-Coupled Post-training Quantization	Aug 13, 2020	Quantization	—Unverified
FATNN: Fast and Accurate Ternary Neural Networks	Aug 12, 2020	image-classificationImage Classification	—Unverified
Leveraging Automated Mixed-Low-Precision Quantization for tiny edge microcontrollers	Aug 12, 2020	Quantization	—Unverified
Compression of Deep Learning Models for Text: A Survey	Aug 12, 2020	Deep LearningInformation Retrieval	—Unverified
Degree-Quant: Quantization-Aware Training for Graph Neural Networks	Aug 11, 2020	CPUGraph Classification	—Unverified
Hardware-Centric AutoML for Mixed-Precision Quantization	Aug 11, 2020	AutoMLQuantization	—Unverified
Unsupervised Learning For Sequence-to-sequence Text-to-speech For Low-resource Languages	Aug 11, 2020	Quantizationtext-to-speech	—Unverified
End-to-End Rate-Distortion Optimization for Bi-Directional Learned Video Compression	Aug 11, 2020	Motion EstimationQuantization	—Unverified
The Sockeye 2 Neural Machine Translation Toolkit at AMTA 2020	Aug 11, 2020	CPUMachine Translation	—Unverified

Show:10 25 50

← PrevPage 77 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified