Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2051–2075 of 4925 papers

Title	Date	Tasks	Status
Fast, Compact, and High Quality LSTM-RNN Based Statistical Parametric Speech Synthesizers for Mobile Devices	Jun 20, 2016	QuantizationSpeech Synthesis	—Unverified
Communication-Efficient Federated Learning via Optimal Client Sampling	Jul 30, 2020	Federated LearningLanguage Modeling	—Unverified
Fast binary embeddings, and quantized compressed sensing with structured matrices	Jan 26, 2018	compressed sensingQuantization	—Unverified
Fast Autoregressive Models for Continuous Latent Generation	Apr 24, 2025	DenoisingImage Generation	—Unverified
Communication Efficient Federated Learning over Multiple Access Channels	Jan 23, 2020	Federated LearningInformativeness	—Unverified
Quantum Block-Matching Algorithm using Dissimilarity Measure	Sep 27, 2023	ClusteringImage Clustering	—Unverified
Communication-Efficient Federated Distillation	Dec 1, 2020	Federated Learningimage-classification	—Unverified
FAQS: Communication-efficient Federate DNN Architecture and Quantization Co-Search for personalized Hardware-aware Preferences	Oct 16, 2022	Neural Architecture SearchQuantization	—Unverified
FAQ: Mitigating the Impact of Faults in the Weight Memory of DNN Accelerators through Fault-Aware Quantization	May 21, 2023	Quantization	—Unverified
FantastIC4: A Hardware-Software Co-Design Approach for Efficiently Running 4bit-Compact Multilayer Perceptrons	Dec 17, 2020	Quantization	—Unverified
FAMES: Fast Approximate Multiplier Substitution for Mixed-Precision Quantized DNNs--Down to 2 Bits!	Nov 27, 2024	Quantization	—Unverified
Communication Efficient Distributed Learning with Censored, Quantized, and Generalized Group ADMM	Sep 14, 2020	Quantization	—Unverified
Reducing Channel Estimation and Feedback Overhead in IRS-Aided Downlink System: A Quantize-then-Estimate Approach	Aug 4, 2023	Quantization	—Unverified
Accelerating RNN-based Speech Enhancement on a Multi-Core MCU with Mixed FP16-INT8 Post-Training Quantization	Oct 14, 2022	QuantizationSpeech Enhancement	—Unverified
3DMolNet: A Generative Network for Molecular Structures	Oct 8, 2020	QuantizationTranslation	—Unverified
False Detection (Positives and Negatives) in Object Detection	Aug 16, 2020	Objectobject-detection	—Unverified
Communication-Efficient Decentralized Multi-Agent Reinforcement Learning for Cooperative Adaptive Cruise Control	Aug 4, 2023	Autonomous VehiclesMulti-agent Reinforcement Learning	—Unverified
FactorizeNet: Progressive Depth Factorization for Efficient Network Architecture Exploration Under Quantization Constraints	Nov 30, 2020	Quantization	—Unverified
A Quantization-based Technique for Privacy Preserving Distributed Learning	Jun 26, 2024	Privacy PreservingQuantization	—Unverified
Factorized Visual Tokenization and Generation	Nov 25, 2024	DisentanglementImage Generation	—Unverified
Face recognition using color local binary pattern from mutually independent color channels	Dec 31, 2014	Face DetectionFace Recognition	—Unverified
Extremely Low Bit Transformer Quantization for On-Device Neural Machine Translation	Sep 16, 2020	Machine TranslationNMT	—Unverified
Communication Compression for Tensor Parallel LLM Inference	Nov 14, 2024	Quantization	—Unverified
A Quantitative Approach To The Temporal Dependency in Video Coding	Aug 26, 2021	Motion CompensationQuantization	—Unverified
Extremely Low Bit Neural Network: Squeeze the Last Bit Out with ADMM	Jul 24, 2017	object-detectionObject Detection	—Unverified

Show:10 25 50

← PrevPage 83 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified