Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3251–3300 of 4925 papers

Title	Date	Tasks	Status	Hype
On the Acceleration of Deep Neural Network Inference using Quantized Compressed Sensing	Aug 23, 2021	compressed sensingQuantization	—Unverified	0
Rate distortion comparison of a few gradient quantizers	Aug 23, 2021	Quantization	—Unverified	0
Reconfigurable co-processor architecture with limited numerical precision to accelerate deep convolutional neural networks	Aug 21, 2021	Quantization	—Unverified	0
Integer-arithmetic-only Certified Robustness for Quantized Neural Networks	Aug 21, 2021	Quantization	—Unverified	0
Quantization Backdoors to Deep Learning Commercial Frameworks	Aug 20, 2021	Deep LearningQuantization	—Unverified	0
Verifying Low-dimensional Input Neural Networks via Input Quantization	Aug 18, 2021	Collision AvoidanceQuantization	—Unverified	0
Deployment of Deep Neural Networks for Object Detection on Edge AI Devices with Runtime Optimization	Aug 18, 2021	2D Object Detection3D Object Detection	—Unverified	0
Distance-aware Quantization	Aug 16, 2021	Quantization	—Unverified	0
FOX-NAS: Fast, On-device and Explainable Neural Architecture Search	Aug 14, 2021	CPUNeural Architecture Search	CodeCode Available	1
Pruning vs XNOR-Net: A Comprehensive Study of Deep Learning for Audio Classification on Edge-devices	Aug 13, 2021	Audio ClassificationClassification	CodeCode Available	0
Audio Spectral Enhancement: Leveraging Autoencoders for Low Latency Reconstruction of Long, Lossy Audio Sequences	Aug 8, 2021	Audio CompressionQuantization	CodeCode Available	0
Energy Efficiency Maximization Precoding for Quantized Massive MIMO Systems	Aug 6, 2021	Quantization	—Unverified	0
Generalizable Mixed-Precision Quantization via Attribution Rank Preservation	Aug 5, 2021	Quantization	CodeCode Available	1
Bifocal Neural ASR: Exploiting Keyword Spotting for Inference Optimization	Aug 3, 2021	Inference OptimizationKeyword Spotting	—Unverified	0
MOHAQ: Multi-Objective Hardware-Aware Quantization of Recurrent Neural Networks	Aug 2, 2021	Quantizationspeech-recognition	—Unverified	0
All-Digital LoS MIMO with Low-Precision Analog-to-Digital Conversion	Aug 2, 2021	AllQuantization	—Unverified	0
Communication-Efficient Federated Learning via Predictive Coding	Aug 2, 2021	Data CompressionFederated Learning	CodeCode Available	0
Jointly Optimizing Query Encoder and Product Quantization to Improve Retrieval Performance	Aug 2, 2021	CPUGPU	CodeCode Available	1
DQ-SGD: Dynamic Quantization in SGD for Communication-Efficient Distributed Learning	Jul 30, 2021	Quantization	—Unverified	0
Connecting Compression Spaces with Transformer for Approximate Nearest Neighbor Search	Jul 30, 2021	Feature CompressionInformation Retrieval	—Unverified	0
Local Morphometry of Closed, Implicit Surfaces	Jul 29, 2021	HippocampusQuantization	—Unverified	0
Sparse Joint Transmission for Cloud Radio Access Networks with Limited Fronthaul Capacity	Jul 29, 2021	Quantization	—Unverified	0
QuPeD: Quantized Personalization via Distillation with Applications to Federated Learning	Jul 29, 2021	Federated LearningKnowledge Distillation	—Unverified	0
Adaptive Precision Training (AdaPT): A dynamic fixed point quantized training approach for DNNs	Jul 28, 2021	Quantization	—Unverified	0
Uniformity in Heterogeneity:Diving Deep into Count Interval Partition for Crowd Counting	Jul 27, 2021	Crowd CountingQuantization	CodeCode Available	1
DV-Det: Efficient 3D Point Cloud Object Detection with Dynamic Voxelization	Jul 27, 2021	3D Object Detectionobject-detection	—Unverified	0
High-Dimensional Distribution Generation Through Deep Neural Networks	Jul 26, 2021	QuantizationVocal Bursts Intensity Prediction	—Unverified	0
HYPER-SNN: Towards Energy-efficient Quantized Deep Spiking Neural Networks for Hyperspectral Image Classification	Jul 26, 2021	Computational EfficiencyHyperspectral Image Classification	—Unverified	0
Deep Learning for Estimation and Pilot Signal Design in Few-Bit Massive MIMO Systems	Jul 26, 2021	Quantization	—Unverified	0
Finite-Bit Quantization For Distributed Algorithms With Linear Convergence	Jul 23, 2021	Quantization	—Unverified	0
Pruning Ternary Quantization	Jul 23, 2021	image-classificationImage Classification	—Unverified	0
Kramers-Kronig Receiver Combined With Digital Resolution Enhancer	Jul 22, 2021	Quantization	—Unverified	0
HARP-Net: Hyper-Autoencoded Reconstruction Propagation for Scalable Neural Audio Coding	Jul 22, 2021	DecoderQuantization	—Unverified	0
CREW: Computation Reuse and Efficient Weight Storage for Hardware-accelerated MLPs and RNNs	Jul 20, 2021	Quantization	—Unverified	0
Support Recovery in Universal One-bit Compressed Sensing	Jul 19, 2021	compressed sensingQuantization	—Unverified	0
DHNet: Double MPEG-4 Compression Detection via Multiple DCT Histograms	Jul 19, 2021	Quantization	—Unverified	0
A High-Performance Adaptive Quantization Approach for Edge CNN Applications	Jul 18, 2021	image-classificationImage Classification	—Unverified	0
Deep Learning to Ternary Hash Codes by Continuation	Jul 16, 2021	Deep LearningImage Retrieval	—Unverified	0
Continuous-variable neural-network quantum states and the quantum rotor model	Jul 15, 2021	QuantizationVariational Monte Carlo	CodeCode Available	0
MAFAT: Memory-Aware Fusing and Tiling of Neural Networks for Accelerated Edge Inference	Jul 14, 2021	object-detectionObject Detection	—Unverified	0
Efficient Approximate Search for Sets of Vectors	Jul 14, 2021	Quantization	—Unverified	0
Regularized Classification-Aware Quantization	Jul 12, 2021	Binary ClassificationClassification	CodeCode Available	0
LANA: Latency Aware Network Acceleration	Jul 12, 2021	CPUGPU	—Unverified	0
HEMP: High-order Entropy Minimization for neural network comPression	Jul 12, 2021	Neural Network CompressionQuantization	—Unverified	0
Model compression as constrained optimization, with application to neural nets. Part V: combining compressions	Jul 9, 2021	Additive modelsLow-rank compression	—Unverified	0
Patch-Wise Spatial-Temporal Quality Enhancement for HEVC Compressed Video	Jul 8, 2021	QuantizationVideo Enhancement	CodeCode Available	0
An Embedded Iris Recognition System Optimization using Dynamically ReconfigurableDecoder with LDPC Codes	Jul 8, 2021	DecoderIris Recognition	—Unverified	0
Image restoration quality assessment based on regional differential information entropy	Jul 8, 2021	Image Quality AssessmentImage Restoration	—Unverified	0
SimCC: a Simple Coordinate Classification Perspective for Human Pose Estimation	Jul 7, 2021	ClassificationPose Estimation	CodeCode Available	1
Deep Learning Methods for Joint Optimization of Beamforming and Fronthaul Quantization in Cloud Radio Access Networks	Jul 6, 2021	Quantization	—Unverified	0

Show:10 25 50

← PrevPage 66 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified