Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2151–2175 of 4925 papers

Title	Date	Tasks	Status
Adaptive Transmission for Distributed Detection in Energy Harvesting Wireless Sensor Networks	Mar 3, 2021	Quantization	—Unverified
Accelerating Inference and Language Model Fusion of Recurrent Neural Network Transducers via End-to-End 4-bit Quantization	Jun 16, 2022	Language ModelingLanguage Modelling	—Unverified
Evaluating the Practicality of Learned Image Compression	Jul 29, 2022	CPUGPU	—Unverified
COAP: Memory-Efficient Training with Correlation-Aware Gradient Projection	Nov 26, 2024	Quantization	—Unverified
CNN inference acceleration using dictionary of centroids	Oct 19, 2018	QuantizationTensor Decomposition	—Unverified
Evaluating Post-Training Compression in GANs using Locality-Sensitive Hashing	Mar 22, 2021	DiversityQuantization	—Unverified
CNN-Based Equalization for Communications: Achieving Gigabit Throughput with a Flexible FPGA Hardware Architecture	Apr 22, 2024	GPUQuantization	—Unverified
Adaptive Training of Random Mapping for Data Quantization	Jun 28, 2016	Quantization	—Unverified
EuclidNets: Combining hardware and architecture design for Efficient Inference and Training	May 21, 2021	Quantization	—Unverified
EuclidNets: An Alternative Operation for Efficient Inference of Deep Learning Models	Dec 22, 2022	Deep LearningQuantization	—Unverified
CNN-based Analog CSI Feedback in FDD MIMO-OFDM Systems	Oct 23, 2019	DiversityQuantization	—Unverified
Estimation and Quantization of Expected Persistence Diagrams	May 11, 2021	QuantizationTime Series	—Unverified
CNN Acceleration by Low-rank Approximation with Quantized Factors	Jun 16, 2020	Quantization	—Unverified
Approximate search with quantized sparse representations	Aug 10, 2016	Quantization	—Unverified
Estimating the Completeness of Discrete Speech Units	Sep 9, 2024	DisentanglementQuantization	—Unverified
CNN2Gate: Toward Designing a General Framework for Implementation of Convolutional Neural Networks on FPGA	Apr 6, 2020	QuantizationReinforcement Learning	—Unverified
ESE: Efficient Speech Recognition Engine with Sparse LSTM on FPGA	Dec 1, 2016	CPUGPU	—Unverified
ESC-MVQ: End-to-End Semantic Communication With Multi-Codebook Vector Quantization	Apr 16, 2025	DecoderQuantization	—Unverified
Cluster Regularized Quantization for Deep Networks Compression	Feb 27, 2019	Quantization	—Unverified
Approximate Probabilistic Neural Networks with Gated Threshold Logic	Aug 2, 2018	General ClassificationQuantization	—Unverified
Adaptive Sample-space & Adaptive Probability coding: a neural-network based approach for compression	May 1, 2019	Data CompressionEfficient Neural Network	—Unverified
eSampling: Energy Harvesting ADCs	Jul 16, 2020	Quantization	—Unverified
ERVQ: Enhanced Residual Vector Quantization with Intra-and-Inter-Codebook Optimization for Neural Audio Codecs	Oct 16, 2024	DiversityOnline Clustering	—Unverified
Towards Feature Distribution Alignment and Diversity Enhancement for Data-Free Quantization	Apr 30, 2022	Data Free QuantizationDiversity	—Unverified
Error Feedback Approach for Quantization Noise Reduction of Distributed Graph Filters	Dec 7, 2024	Quantization	—Unverified

Show:10 25 50

← PrevPage 87 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified