Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3051–3100 of 4925 papers

Title	Date	Tasks	Status	Hype
Nearest neighbor search with compact codes: A decoder perspective	Dec 17, 2021	DecoderQuantization	—Unverified	0
End-to-End Rate-Distortion Optimized Learned Hierarchical Bi-Directional Video Compression	Dec 17, 2021	Motion EstimationMS-SSIM	CodeCode Available	1
Approximation of functions with one-bit neural networks	Dec 16, 2021	Quantization	—Unverified	0
Deep Hash Distillation for Image Retrieval	Dec 16, 2021	Data AugmentationDeep Hashing	CodeCode Available	1
TAFA: Design Automation of Analog Mixed-Signal FIR Filters Using Time Approximation Architecture	Dec 15, 2021	Quantization	—Unverified	0
On Recursive State Estimation for Linear State-Space Models Having Quantized Output Data	Dec 15, 2021	QuantizationState Estimation	—Unverified	0
N3H-Core: Neuron-designed Neural Network Accelerator via FPGA-based Heterogeneous Computing Cores	Dec 15, 2021	Quantization	CodeCode Available	1
Boosted Dense Retriever	Dec 14, 2021	QuantizationRetrieval	—Unverified	0
Modeling Image Quantization Tradeoffs for Optimal Compression	Dec 14, 2021	Quantization	—Unverified	0
Illumination and Temperature-Aware Multispectral Networks for Edge-Computing-Enabled Pedestrian Detection	Dec 9, 2021	Edge-computingGPU	—Unverified	0
Neural Network Quantization for Efficient Inference: A Survey	Dec 8, 2021	QuantizationSurvey	—Unverified	0
Implicit Neural Representations for Image Compression	Dec 8, 2021	Image CompressionQuantization	—Unverified	0
FastSGD: A Fast Compressed SGD Framework for Distributed Machine Learning	Dec 8, 2021	BIG-bench Machine LearningQuantization	—Unverified	0
Efficient Batch Homomorphic Encryption for Vertically Federated XGBoost	Dec 8, 2021	Federated LearningQuantization	—Unverified	0
A Generalized Zero-Shot Quantization of Deep Convolutional Neural Networks via Learned Weights Statistics	Dec 6, 2021	Quantization	—Unverified	0
A comparison study of CNN denoisers on PRNU extraction	Dec 6, 2021	DenoisingImage Denoising	—Unverified	0
HHF: Hashing-guided Hinge Function for Deep Hashing Retrieval	Dec 4, 2021	BinarizationDeep Hashing	CodeCode Available	1
Towards Low-loss 1-bit Quantization of User-item Representations for Top-K Recommendation	Dec 3, 2021	QuantizationRecommendation Systems	—Unverified	0
Equal Bits: Enforcing Equally Distributed Binary Network Weights	Dec 2, 2021	BinarizationQuantization	CodeCode Available	0
Hardware-friendly Deep Learning by Network Quantization and Binarization	Dec 1, 2021	BinarizationDeep Learning	—Unverified	0
High-Resolution WiFi Imaging with Reconfigurable Intelligent Surfaces	Dec 1, 2021	Privacy PreservingQuantization	—Unverified	0
Attribute Artifacts Removal for Geometry-based Point Cloud Compression	Dec 1, 2021	AttributeGraph Attention	—Unverified	0
Exploration into Translation-Equivariant Image Quantization	Dec 1, 2021	Image GenerationImage to text	CodeCode Available	0
Adaptive Proximal Gradient Methods for Structured Neural Networks	Dec 1, 2021	Quantization	—Unverified	0
Communication-Efficient Federated Learning via Quantized Compressed Sensing	Nov 30, 2021	compressed sensingFederated Learning	—Unverified	0
A Highly Effective Low-Rank Compression of Deep Neural Networks with Modified Beam-Search and Modified Stable Rank	Nov 30, 2021	Low-rank compressionQuantization	—Unverified	0
Mixed Precision Low-bit Quantization of Neural Network Language Models for Speech Recognition	Nov 29, 2021	Neural Architecture SearchQuantization	—Unverified	0
Mixed Precision of Quantization of Transformer Language Models for Speech Recognition	Nov 29, 2021	QuantizationSensitivity	—Unverified	0
Low-bit Quantization of Recurrent Neural Network Language Models Using Alternating Direction Methods of Multipliers	Nov 29, 2021	Quantization	—Unverified	0
Nonuniform-to-Uniform Quantization: Towards Accurate Quantization via Generalized Straight-Through Estimation	Nov 29, 2021	Quantization	CodeCode Available	1
Enabling Fast Deep Learning on Tiny Energy-Harvesting IoT Devices	Nov 28, 2021	Deep LearningQuantization	—Unverified	0
FQ-ViT: Post-Training Quantization for Fully Quantized Vision Transformer	Nov 27, 2021	Quantization	CodeCode Available	1
An Optimization Framework for Federated Edge Learning	Nov 26, 2021	Edge-computingFederated Learning	—Unverified	0
A Novel Framework for Image-to-image Translation and Image Compression	Nov 25, 2021	Image CompressionImage Generation	—Unverified	0
QNNVerifier: A Tool for Verifying Neural Networks using SMT-Based Model Checking	Nov 25, 2021	Quantization	—Unverified	0
PTQ4ViT: Post-training quantization for vision transformers with twin uniform quantization	Nov 24, 2021	Quantization	CodeCode Available	1
Sharpness-aware Quantization for Deep Neural Networks	Nov 24, 2021	Image ClassificationModel Compression	CodeCode Available	1
Non-Intrusive Binaural Speech Intelligibility Prediction from Discrete Latent Representations	Nov 24, 2021	Quantization	CodeCode Available	1
Accelerating Deep Learning with Dynamic Data Pruning	Nov 24, 2021	AttributeDeep Learning	—Unverified	0
HERO: Hessian-Enhanced Robust Optimization for Unifying and Improving Generalization and Quantization Performance	Nov 23, 2021	Quantization	CodeCode Available	0
Mesa: A Memory-saving Training Framework for Transformers	Nov 22, 2021	Quantization	CodeCode Available	1
Full-Duplex Massive MIMO Cellular Networks with Low Resolution ADC/DAC	Nov 20, 2021	Quantization	—Unverified	0
Optimization of Quantized Phase Shifts for Reconfigurable Smart Surfaces Assisted Communications	Nov 19, 2021	Quantization	—Unverified	0
Toward Compact Parameter Representations for Architecture-Agnostic Neural Network Compression	Nov 19, 2021	Neural Network CompressionQuantization	—Unverified	0
Reconstruction-Computation-Quantization (RCQ): A Paradigm for Low Bit Width LDPC Decoding	Nov 17, 2021	DecoderQuantization	—Unverified	0
End-to-End Learned Image Compression with Quantized Weights and Activations	Nov 17, 2021	Image CompressionMS-SSIM	—Unverified	0
Low Precision Decentralized Distributed Training over IID and non-IID Data	Nov 17, 2021	Quantization	CodeCode Available	0
IntraQ: Learning Synthetic Images with Intra-Class Heterogeneity for Zero-Shot Network Quantization	Nov 17, 2021	Quantization	CodeCode Available	1
Compact Token Representations with Contextual Quantization for Efficient Document Re-ranking	Nov 16, 2021	QuantizationRe-Ranking	—Unverified	0
VQN: Variable Quantization Noise for Neural Network Compression	Nov 16, 2021	Neural Network CompressionQuantization	—Unverified	0

Show:10 25 50

← PrevPage 62 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified