Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3101–3150 of 4925 papers

Title	Date	Tasks	Status
Towards Lossless ANN-SNN Conversion under Ultra-Low Latency with Dual-Phase Optimization	May 16, 2022	object-detectionObject Detection	CodeCode Available
Real-time semantic segmentation on FPGAs for autonomous vehicles with hls4ml	May 16, 2022	Autonomous DrivingAutonomous Vehicles	—Unverified
A Comprehensive Survey on Model Quantization for Deep Neural Networks in Image Classification	May 14, 2022	image-classificationImage Classification	—Unverified
Tighter Regret Analysis and Optimization of Online Federated Learning	May 13, 2022	Federated LearningQuantization	—Unverified
Adaptive Block Floating-Point for Analog Deep Learning Hardware	May 12, 2022	Deep LearningQuantization	—Unverified
Neural Network-based OFDM Receiver for Resource Constrained IoT Devices	May 12, 2022	Quantization	—Unverified
Neuromimetic Linear Systems -- Resilience and Learning	May 10, 2022	Combinatorial OptimizationQ-Learning	—Unverified
Serving and Optimizing Machine Learning Workflows on Heterogeneous Infrastructures	May 10, 2022	AutoMLBIG-bench Machine Learning	—Unverified
A 14uJ/Decision Keyword Spotting Accelerator with In-SRAM-Computing and On Chip Learning for Customization	May 10, 2022	Keyword SpottingQuantization	—Unverified
Protecting Data from all Parties: Combining FHE and DP in Federated Learning	May 9, 2022	AllFederated Learning	—Unverified
Block Modulating Video Compression: An Ultra Low Complexity Image Compression Encoder for Resource Limited Platforms	May 7, 2022	DecoderImage Compression	—Unverified
Online Model Compression for Federated Learning with Large Models	May 6, 2022	Federated LearningModel Compression	—Unverified
MemSE: Fast MSE Prediction for Noisy Memristor-Based DNN Accelerators	May 3, 2022	Quantization	—Unverified
Towards Feature Distribution Alignment and Diversity Enhancement for Data-Free Quantization	Apr 30, 2022	Data Free QuantizationDiversity	—Unverified
Enable Deep Learning on Mobile Devices: Methods, Systems, and Applications	Apr 25, 2022	AutoMLDeep Learning	—Unverified
Federated Learning with Lossy Distributed Source Coding: Analysis and Optimization	Apr 23, 2022	Federated LearningQuantization	—Unverified
Improving Self-Supervised Learning-based MOS Prediction Networks	Apr 23, 2022	PredictionQuantization	CodeCode Available
A Tale of Two Models: Constructing Evasive Attacks on Edge Models	Apr 22, 2022	QuantizationVocal Bursts Valence Prediction	CodeCode Available
Arbitrary Bit-width Network: A Joint Layer-Wise Quantization and Adaptive Inference Approach	Apr 21, 2022	Quantization	—Unverified
How to Attain Communication-Efficient DNN Training? Convert, Compress, Correct	Apr 18, 2022	Quantization	—Unverified
Unconditional Image-Text Pair Generation with Multimodal Cross Quantizer	Apr 15, 2022	multimodal generationQuantization	CodeCode Available
INSTA-BNN: Binary Neural Network with INSTAnce-aware Threshold	Apr 15, 2022	Quantization	—Unverified
Composite Code Sparse Autoencoders for first stage retrieval	Apr 14, 2022	Image RetrievalInformation Retrieval	—Unverified
Secure Formation Control via Edge Computing Enabled by Fully Homomorphic Encryption and Mixed Uniform-Logarithmic Quantization	Apr 13, 2022	Edge-computingQuantization	—Unverified
Joint Coreset Construction and Quantization for Distributed Machine Learning	Apr 13, 2022	BIG-bench Machine LearningQuantization	—Unverified
Channel Pruning In Quantization-aware Training: An Adaptive Projection-gradient Descent-shrinkage-splitting Method	Apr 9, 2022	Quantization	—Unverified
Non-asymptotic spectral bounds on the -entropy of kernel classes	Apr 9, 2022	Quantization	—Unverified
Data-Free Quantization with Accurate Activation Clipping and Adaptive Batch Normalization	Apr 8, 2022	Data Free QuantizationQuantization	—Unverified
Deep Learning-Based Intra Mode Derivation for Versatile Video Coding	Apr 8, 2022	Deep LearningMulti-class Classification	—Unverified
Characterizing and Understanding the Behavior of Quantized Models for Reliable Deployment	Apr 8, 2022	Image to textLanguage Modeling	CodeCode Available
Unsupervised Quantized Prosody Representation for Controllable Speech Synthesis	Apr 7, 2022	QuantizationSpeech Synthesis	—Unverified
Bimodal Distributed Binarized Neural Networks	Apr 5, 2022	BinarizationQuantization	CodeCode Available
Cancer Subtyping via Embedded Unsupervised Learning on Transcriptomics Data	Apr 2, 2022	Quantization	—Unverified
Scaling Language Model Size in Cross-Device Federated Learning	Mar 31, 2022	Federated LearningLanguage Modeling	—Unverified
Ternary and Binary Quantization for Improved Classification	Mar 31, 2022	ClassificationDimensionality Reduction	—Unverified
Eventor: An Efficient Event-Based Monocular Multi-View Stereo Accelerator on FPGA Platform	Mar 29, 2022	CPUQuantization	—Unverified
Compact Token Representations with Contextual Quantization for Efficient Document Re-ranking	Mar 29, 2022	QuantizationRe-Ranking	—Unverified
Autoregressive Co-Training for Learning Discrete Speech Representations	Mar 29, 2022	Quantization	CodeCode Available
Reverse Link Analysis for Full-Duplex Cellular Networks with Low Resolution ADC/DAC	Mar 28, 2022	Quantization	—Unverified
REx: Data-Free Residual Quantization Error Expansion	Mar 28, 2022	Quantization	—Unverified
New pyramidal hybrid textural and deep features based automatic skin cancer classification model: Ensemble DarkNet and textural feature extractor	Mar 28, 2022	Cancer ClassificationQuantization	—Unverified
SPIQ: Data-Free Per-Channel Static Input Quantization	Mar 28, 2022	Data Free Quantizationobject-detection	—Unverified
LAMBDA: Covering the Solution Set of Black-Box Inequality by Search Space Quantization	Mar 25, 2022	BenchmarkingQuantization	—Unverified
MKQ-BERT: Quantized BERT with 4-bits Weights and Activations	Mar 25, 2022	Quantization	—Unverified
Fast on-line signature recognition based on VQ with time modeling	Mar 23, 2022	Quantization	—Unverified
Mokey: Enabling Narrow Fixed-Point Inference for Out-of-the-Box Floating-Point Transformer Models	Mar 23, 2022	Quantization	—Unverified
FxP-QNet: A Post-Training Quantizer for the Design of Mixed Low-Precision DNNs with Dynamic Fixed-Point Representation	Mar 22, 2022	Quantization	—Unverified
Compression of Generative Pre-trained Language Models via Quantization	Mar 21, 2022	Model CompressionQuantization	—Unverified
Symbol quantization in interstellar communications: methods and observations	Mar 18, 2022	Quantization	—Unverified
Image Storage on Synthetic DNA Using Autoencoders	Mar 18, 2022	Image CompressionQuantization	—Unverified

Show:10 25 50

← PrevPage 63 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified