Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2901–2950 of 4925 papers

Title	Date	Tasks	Status
Accelerating RNN-based Speech Enhancement on a Multi-Core MCU with Mixed FP16-INT8 Post-Training Quantization	Oct 14, 2022	QuantizationSpeech Enhancement	—Unverified
SNN-SC: A Spiking Semantic Communication Framework for Collaborative Intelligence	Oct 13, 2022	ClassificationQuantization	CodeCode Available
SQuAT: Sharpness- and Quantization-Aware Training for BERT	Oct 13, 2022	Quantization	—Unverified
ScionFL: Efficient and Robust Secure Quantized Aggregation	Oct 13, 2022	Federated LearningQuantization	—Unverified
Statistical Modeling of Soft Error Influence on Neural Networks	Oct 12, 2022	Quantization	—Unverified
Deep learning model compression using network sensitivity and gradients	Oct 11, 2022	Deep LearningModel Compression	—Unverified
Super-Resolution by Predicting Offsets: An Ultra-Efficient Super-Resolution Network for Rasterized Images	Oct 9, 2022	QuantizationSuper-Resolution	—Unverified
AlphaTuning: Quantization-Aware Parameter-Efficient Adaptation of Large-Scale Pre-Trained Language Models	Oct 8, 2022	Language ModelingLanguage Modelling	—Unverified
Learning to embed semantic similarity for joint image-text retrieval	Oct 7, 2022	Image-text RetrievalMetric Learning	—Unverified
IR2Net: Information Restriction and Information Recovery for Accurate Binary Neural Networks	Oct 6, 2022	BinarizationQuantization	CodeCode Available
Self-triggered Consensus of Multi-agent Systems with Quantized Relative State Measurements	Oct 6, 2022	Quantization	—Unverified
Sampling Streaming Data with Parallel Vector Quantization -- PVQ	Oct 4, 2022	Hyperparameter OptimizationQuantization	—Unverified
A Novel Light Field Coding Scheme Based on Deep Belief Network & Weighted Binary Images for Additive Layered Displays	Oct 4, 2022	Mixed RealityQuantization	—Unverified
Convolutional Neural Networks Quantization with Attention	Sep 30, 2022	Quantization	—Unverified
Goal-Oriented Quantization: Analysis, Design, and Application to Resource Allocation	Sep 30, 2022	Quantization	—Unverified
A Secure Federated Learning Framework for Residential Short Term Load Forecasting	Sep 29, 2022	Demand ForecastingFederated Learning	—Unverified
Speech Enhancement Using Self-Supervised Pre-Trained Model and Vector Quantization	Sep 28, 2022	DecoderDenoising	—Unverified
Physics-aware Differentiable Discrete Codesign for Diffractive Optical Neural Networks	Sep 28, 2022	Quantization	—Unverified
Multi-Sample Training for Neural Image Compression	Sep 28, 2022	Image CompressionQuantization	—Unverified
The Cramer-Rao Bound for Signal Parameter Estimation from Quantized Data	Sep 27, 2022	parameter estimationQuantization	—Unverified
Device-friendly Guava fruit and leaf disease detection using deep learning	Sep 26, 2022	DiagnosticModel Optimization	CodeCode Available
Going Further With Winograd Convolutions: Tap-Wise Quantization for Efficient Inference on 4x4 Tile	Sep 26, 2022	Quantization	—Unverified
Lightweight Image Codec via Multi-Grid Multi-Block-Size Vector Quantization (MGBVQ)	Sep 25, 2022	Quantization	—Unverified
SpeedLimit: Neural Architecture Search for Quantized Transformer Models	Sep 25, 2022	Neural Architecture SearchQuantization	—Unverified
Vector Quantized Semantic Communication System	Sep 23, 2022	MS-SSIMQuantization	—Unverified
Boost CTR Prediction for New Advertisements via Modeling Visual Content	Sep 23, 2022	Click-Through Rate PredictionPrediction	—Unverified
Performance Optimization for Variable Bitwidth Federated Learning in Wireless Networks	Sep 21, 2022	Federated LearningModel-based Reinforcement Learning	—Unverified
FoVolNet: Fast Volume Rendering using Foveated Deep Neural Networks	Sep 20, 2022	Data VisualizationImage Reconstruction	—Unverified
Flexible Neural Image Compression via Code Editing	Sep 19, 2022	DecoderImage Compression	—Unverified
SAMP: A Model Inference Toolkit of Post-Training Quantization for Text Processing via Self-Adaptive Mixed-Precision	Sep 19, 2022	Quantization	—Unverified
PIM-QAT: Neural Network Quantization for Processing-In-Memory (PIM) Systems	Sep 18, 2022	Quantization	—Unverified
Quantization for decentralized learning under subspace constraints	Sep 16, 2022	Quantization	—Unverified
Compressed Particle-Based Federated Bayesian Learning and Unlearning	Sep 14, 2022	Quantization	—Unverified
Analysis of Quantization on MLP-based Vision Models	Sep 14, 2022	Model CompressionQuantization	—Unverified
SeRP: Self-Supervised Representation Learning Using Perturbed Point Clouds	Sep 13, 2022	DecoderQuantization	—Unverified
In-situ animal behavior classification using knowledge distillation and fixed-point quantization	Sep 9, 2022	ClassificationKnowledge Distillation	—Unverified
Compact and Robust Deep Learning Architecture for Fluorescence Lifetime Imaging and FPGA Implementation	Sep 7, 2022	Quantization	—Unverified
A simple approach for quantizing neural networks	Sep 7, 2022	Quantization	—Unverified
Towards Intelligent Millimeter and Terahertz Communication for 6G: Computer Vision-aided Beamforming	Sep 6, 2022	ManagementQuantization	—Unverified
Optimized Precoding for MU-MIMO With Fronthaul Quantization	Sep 5, 2022	Quantization	—Unverified
SaleNet: A low-power end-to-end CNN accelerator for sustained attention level evaluation using EEG	Sep 3, 2022	ClusteringEEG	—Unverified
Low-Power Hardware-Based Deep-Learning Diagnostics Support Case Study	Sep 3, 2022	CPUDeep Learning	—Unverified
Augmented Deep Unfolding for Downlink Beamforming in Multi-cell Massive MIMO With Limited Feedback	Sep 3, 2022	Quantization	—Unverified
PulseDL-II: A System-on-Chip Neural Network Accelerator for Timing and Energy Extraction of Nuclear Detector Signals	Sep 2, 2022	CPUDeep Learning	—Unverified
Human Activity Recognition on Microcontrollers with Quantized and Adaptive Deep Neural Networks	Sep 2, 2022	Activity RecognitionHuman Activity Recognition	—Unverified
On Quantizing Implicit Neural Representations	Sep 1, 2022	Image ReconstructionNeRF	—Unverified
XCAT -- Lightweight Quantized Single Image Super-Resolution using Heterogeneous Group Convolutions and Cross Concatenation	Aug 31, 2022	Data AugmentationGPU	—Unverified
QuantNAS for super resolution: searching for efficient quantization-friendly architectures against quantization noise	Aug 31, 2022	Efficient Neural NetworkImage Super-Resolution	CodeCode Available
Distributed CPU Scheduling Subject to Nonlinear Constraints	Aug 30, 2022	CPUDistributed Optimization	—Unverified
Distributed Constraint-Coupled Optimization over Lossy Networks	Aug 30, 2022	Quantization	—Unverified

Show:10 25 50

← PrevPage 59 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified