Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 751–800 of 4925 papers

Title	Date	Tasks	Status	Hype
Differentiable Model Compression via Pseudo Quantization Noise	Apr 20, 2021	Audio Source Separationimage-classification	CodeCode Available	1
Conditional Coding and Variable Bitrate for Practical Learned Video Coding	Apr 19, 2021	DecoderQuantization	CodeCode Available	1
Matching-oriented Product Quantization For Ad-hoc Retrieval	Apr 16, 2021	QuantizationRetrieval	CodeCode Available	1
Distributed Learning Systems with First-order Methods	Apr 12, 2021	BIG-bench Machine LearningManagement	CodeCode Available	1
Quantized Gromov-Wasserstein	Apr 5, 2021	Quantization	CodeCode Available	1
Network Quantization with Element-wise Gradient Scaling	Apr 2, 2021	image-classificationImage Classification	CodeCode Available	1
Training Multi-bit Quantized and Binarized Networks with A Learnable Symmetric Quantizer	Apr 1, 2021	BinarizationQuantization	CodeCode Available	1
Integer-only Zero-shot Quantization for Efficient Speech Recognition	Mar 31, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
ReCU: Reviving the Dead Weights in Binary Neural Networks	Mar 23, 2021	BinarizationQuantization	CodeCode Available	1
Generating Diverse Structure for Image Inpainting With Hierarchical VQ-VAE	Mar 18, 2021	Image InpaintingQuantization	CodeCode Available	1
RangeDet:In Defense of Range View for LiDAR-based 3D Object Detection	Mar 18, 2021	3D Object Detectionobject-detection	CodeCode Available	1
Multi-Prize Lottery Ticket Hypothesis: Finding Accurate Binary Neural Networks by Pruning A Randomly Weighted Network	Mar 17, 2021	Classification with Binary Neural NetworkClassification with Binary Weight Network	CodeCode Available	1
Learning Statistical Texture for Semantic Segmentation	Mar 6, 2021	QuantizationSegmentation	CodeCode Available	1
Environmental Sound Classification on the Edge: A Pipeline for Deep Acoustic Networks on Extremely Resource-Constrained Devices	Mar 5, 2021	Audio ClassificationEnvironmental Sound Classification	CodeCode Available	1
Self-Distribution Binary Neural Networks	Mar 3, 2021	Quantization	CodeCode Available	1
BSQ: Exploring Bit-Level Sparsity for Mixed-Precision Neural Network Quantization	Feb 20, 2021	Neural Architecture SearchQuantization	CodeCode Available	1
FAT: Learning Low-Bitwidth Parametric Representation via Frequency-Aware Transformation	Feb 15, 2021	Model CompressionNeural Network Compression	CodeCode Available	1
Confounding Tradeoffs for Neural Network Quantization	Feb 12, 2021	Quantization	CodeCode Available	1
BRECQ: Pushing the Limit of Post-Training Quantization by Block Reconstruction	Feb 10, 2021	image-classificationImage Classification	CodeCode Available	1
On the Universal Transformation of Data-Driven Models to Control Systems	Feb 9, 2021	Quantization	CodeCode Available	1
Enabling Binary Neural Network Training on the Edge	Feb 8, 2021	Quantization	CodeCode Available	1
Fixed-point Quantization of Convolutional Neural Networks for Quantized Inference on Embedded Platforms	Feb 3, 2021	image-classificationImage Classification	CodeCode Available	1
Benchmarking Quantized Neural Networks on FPGAs with FINN	Feb 2, 2021	BenchmarkingQuantization	CodeCode Available	1
SparseDNN: Fast Sparse Deep Learning Inference on CPUs	Jan 20, 2021	Deep LearningQuantization	CodeCode Available	1
Binary TTC: A Temporal Geofence for Autonomous Navigation	Jan 12, 2021	Autonomous NavigationQuantization	CodeCode Available	1
Improving Neural Network Efficiency via Post-Training Quantization With Adaptive Floating-Point	Jan 1, 2021	Model CompressionQuantization	CodeCode Available	1
RangeDet: In Defense of Range View for LiDAR-Based 3D Object Detection	Jan 1, 2021	3D Object Detectionobject-detection	CodeCode Available	1
Uniformity in Heterogeneity: Diving Deep Into Count Interval Partition for Crowd Counting	Jan 1, 2021	Crowd CountingQuantization	CodeCode Available	1
A Memory Efficient Baseline for Open Domain Question Answering	Dec 30, 2020	Dimensionality ReductionOpen-Domain Question Answering	CodeCode Available	1
Comprehensive Graph-conditional Similarity Preserving Network for Unsupervised Cross-modal Hashing	Dec 25, 2020	QuantizationRetrieval	CodeCode Available	1
FracTrain: Fractionally Squeezing Bit Savings Both Temporally and Spatially for Efficient DNN Training	Dec 24, 2020	Quantization	CodeCode Available	1
DAQ: Channel-Wise Distribution-Aware Quantization for Deep Image Super-Resolution Networks	Dec 21, 2020	Image Super-ResolutionQuantization	CodeCode Available	1
DeCoAR 2.0: Deep Contextualized Acoustic Representations with Vector Quantization	Dec 11, 2020	DiversityQuantization	CodeCode Available	1
Robustness and Transferability of Universal Attacks on Compressed Models	Dec 10, 2020	Neural Network CompressionQuantization	CodeCode Available	1
Going Beyond Classification Accuracy Metrics in Model Compression	Dec 3, 2020	ClassificationEdge-computing	CodeCode Available	1
KD-Lib: A PyTorch library for Knowledge Distillation, Pruning and Quantization	Nov 30, 2020	Knowledge DistillationModel Compression	CodeCode Available	1
Fully Quantized Image Super-Resolution Networks	Nov 29, 2020	Image Super-ResolutionQuantization	CodeCode Available	1
HAWQV3: Dyadic Neural Network Quantization	Nov 20, 2020	Model CompressionQuantization	CodeCode Available	1
PAMS: Quantized Super-Resolution via Parameterized Max Scale	Nov 9, 2020	QuantizationSuper-Resolution	CodeCode Available	1
Short Text Topic Modeling with Topic Distribution Quantization and Negative Sampling Decoder	Nov 1, 2020	DecoderQuantization	CodeCode Available	1
A Greedy Algorithm for Quantizing Neural Networks	Oct 29, 2020	Quantization	CodeCode Available	1
Accordion: Adaptive Gradient Communication via Critical Learning Regime Identification	Oct 29, 2020	Quantization	CodeCode Available	1
Permute, Quantize, and Fine-tune: Efficient Compression of Neural Networks	Oct 29, 2020	image-classificationImage Classification	CodeCode Available	1
A Statistical Framework for Low-bitwidth Training of Deep Neural Networks	Oct 27, 2020	Linguistic AcceptabilityNatural Language Inference	CodeCode Available	1
ShiftAddNet: A Hardware-Inspired Deep Network	Oct 24, 2020	Quantization	CodeCode Available	1
Adaptive Gradient Quantization for Data-Parallel SGD	Oct 23, 2020	Quantization	CodeCode Available	1
Once Quantization-Aware Training: High Performance Extremely Low-bit Architecture Search	Oct 9, 2020	Neural Architecture SearchQuantization	CodeCode Available	1
Rotated Binary Neural Network	Sep 28, 2020	BinarizationQuantization	CodeCode Available	1
Learning to Improve Image Compression without Changing the Standard Decoder	Sep 27, 2020	DecoderImage Compression	CodeCode Available	1
Adaptive Debanding Filter	Sep 22, 2020	Quantization	CodeCode Available	1

Show:10 25 50

← PrevPage 16 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified