Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4201–4250 of 4925 papers

Title	Date	Tasks	Status	Hype
NUQSGD: Improved Communication Efficiency for Data-parallel SGD via Nonuniform Quantization	Aug 16, 2019	Quantization	CodeCode Available	0
Differentiable Soft Quantization: Bridging Full-Precision and Low-Bit Neural Networks	Aug 14, 2019	Quantization	CodeCode Available	0
Learn to Compress CSI and Allocate Resources in Vehicular Networks	Aug 12, 2019	Decision MakingQuantization	—Unverified	0
Unsupervised Neural Quantization for Compressed-Domain Similarity Search	Aug 11, 2019	Image RetrievalQuantization	CodeCode Available	0
Effective Training of Convolutional Neural Networks with Low-bitwidth Weights and Activations	Aug 10, 2019	Knowledge DistillationQuantization	—Unverified	0
Primary quantization matrix estimation of double compressed JPEG images via CNN	Aug 9, 2019	Quantization	CodeCode Available	0
Cheetah: Mixed Low-Precision Hardware & Software Co-Design Framework for DNNs on the Edge	Aug 6, 2019	Quantization	—Unverified	0
GDRQ: Group-based Distribution Reshaping for Quantization	Aug 5, 2019	Quantization	—Unverified	0
U-Net Fixed-Point Quantization for Medical Image Segmentation	Aug 2, 2019	Image SegmentationMedical Image Segmentation	CodeCode Available	0
Efficient computation of counterfactual explanations of LVQ models	Aug 2, 2019	BIG-bench Machine Learningcounterfactual	CodeCode Available	0
Deep Task-Based Quantization	Aug 1, 2019	Quantization	—Unverified	0
Central Similarity Quantization for Efficient Image and Video Retrieval	Aug 1, 2019	QuantizationRetrieval	CodeCode Available	0
Learn to Allocate Resources in Vehicular Networks	Jul 30, 2019	Decision MakingQuantization	—Unverified	0
DeepCABAC: A Universal Compression Algorithm for Deep Neural Networks	Jul 27, 2019	Neural Network CompressionQuantization	CodeCode Available	0
Robust and Communication-Efficient Collaborative Learning	Jul 24, 2019	Quantization	CodeCode Available	0
QRMODA and BRMODA: Novel Models for Face Recognition Accuracy in Computer Vision Systems with Adapted Video Streams	Jul 24, 2019	Face RecognitionQuantization	—Unverified	0
Distributed Average Consensus under Quantized Communication via Event-Triggered Mass Splitting	Jul 23, 2019	Quantization	—Unverified	0
Exploring Semantic Segmentation on the DCT Representation	Jul 23, 2019	QuantizationSegmentation	—Unverified	0
Light Multi-segment Activation for Model Compression	Jul 16, 2019	Knowledge Distillationmodel	CodeCode Available	0
An Inter-Layer Weight Prediction and Quantization for Deep Neural Networks based on a Smoothly Varying Weight Hypothesis	Jul 16, 2019	Quantization	—Unverified	0
Learning Multimodal Fixed-Point Weights using Gradient Descent	Jul 16, 2019	Quantization	—Unverified	0
The Bach Doodle: Approachable music composition with machine learning at scale	Jul 14, 2019	BIG-bench Machine LearningQuantization	—Unverified	0
And the Bit Goes Down: Revisiting the Quantization of Neural Networks	Jul 12, 2019	CPUQuantization	CodeCode Available	1
A Targeted Acceleration and Compression Framework for Low bit Neural Networks	Jul 9, 2019	BinarizationComputational Efficiency	—Unverified	0
Multi-Scale Vector Quantization with Reconstruction Trees	Jul 8, 2019	Quantization	—Unverified	0
Non-Structured DNN Weight Pruning -- Is It Beneficial in Any Platform?	Jul 3, 2019	Model CompressionQuantization	—Unverified	0
Don't take it lightly: Phasing optical random projections with unknown operators	Jul 3, 2019	CPUGPU	CodeCode Available	0
Deep Convolutional Compression for Massive MIMO CSI Feedback	Jul 2, 2019	DiversityQuantization	—Unverified	0
Compression of Acoustic Event Detection Models With Quantized Distillation	Jul 1, 2019	Event DetectionKnowledge Distillation	—Unverified	0
Weight Normalization based Quantization for Deep Neural Network Compression	Jul 1, 2019	Model CompressionNeural Network Compression	—Unverified	0
BTEL: A Binary Tree Encoding Approach for Visual Localization	Jun 27, 2019	Image RetrievalQuantization	—Unverified	0
Detection of small changes in medical and random-dot images comparing self-organizing map performance to human detection	Jun 26, 2019	Decision MakingHuman Detection	—Unverified	0
Gridless Multisnapshot Variational Line Spectral Estimation from Coarsely Quantized Samples	Jun 20, 2019	Quantization	—Unverified	0
Back to Simplicity: How to Train Accurate BNNs from Scratch?	Jun 19, 2019	Quantization	—Unverified	0
Deep Learning-Based Quantization of L-Values for Gray-Coded Modulation	Jun 18, 2019	Quantization	CodeCode Available	0
Quantized Three-Ion-Channel Neuron Model for Neural Action Potentials	Jun 16, 2019	QuantizationQuantum Machine Learning	—Unverified	0
Deep Recurrent Quantization for Generating Sequential Binary Codes	Jun 16, 2019	Image RetrievalQuantization	CodeCode Available	0
Beyond Product Quantization: Deep Progressive Quantization for Image Retrieval	Jun 16, 2019	Image RetrievalQuantization	CodeCode Available	0
Divide and Conquer: Leveraging Intermediate Feature Representations for Quantized Training of Neural Networks	Jun 14, 2019	Knowledge DistillationQuantization	—Unverified	0
Parameterized Structured Pruning for Deep Neural Networks	Jun 12, 2019	Quantization	—Unverified	0
BasisConv: A method for compressed representation and learning in CNNs	Jun 11, 2019	Quantization	—Unverified	0
Data-Free Quantization Through Weight Equalization and Bias Correction	Jun 11, 2019	Data Free Quantizationobject-detection	CodeCode Available	1
Table-Based Neural Units: Fully Quantizing Networks for Multiply-Free Inference	Jun 11, 2019	Quantization	—Unverified	0
Fighting Quantization Bias With Bias	Jun 7, 2019	Quantization	—Unverified	0
Deep Spherical Quantization for Image Search	Jun 7, 2019	Image RetrievalQuantization	—Unverified	0
Word-based Domain Adaptation for Neural Machine Translation	Jun 7, 2019	Domain AdaptationLanguage Modeling	—Unverified	0
Qsparse-local-SGD: Distributed SGD with Quantization, Sparsification, and Local Computations	Jun 6, 2019	Distributed OptimizationQuantization	—Unverified	0
Exploiting Offset-guided Network for Pose Estimation and Tracking	Jun 4, 2019	Human DetectionPose Estimation	—Unverified	0
Constructing Energy-efficient Mixed-precision Neural Networks through Principal Component Analysis for Edge Intelligence	Jun 4, 2019	Autonomous VehiclesDimensionality Reduction	CodeCode Available	0
Efficient 8-Bit Quantization of Transformer Neural Machine Language Translation Model	Jun 3, 2019	CPUQuantization	—Unverified	0

Show:10 25 50

← PrevPage 85 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified