Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2176–2200 of 4925 papers

Title	Date	Tasks	Status
Cluster Pruning: An Efficient Filter Pruning Method for Edge AI Vision Applications	Mar 5, 2020	CPUGPU	—Unverified
Cluster-Promoting Quantization with Bit-Drop for Minimizing Network Quantization Loss	Sep 5, 2021	Quantization	—Unverified
Error Compensated Quantized SGD and its Applications to Large-scale Distributed Optimization	Jun 21, 2018	Distributed OptimizationQuantization	—Unverified
Error-aware Quantization through Noise Tempering	Dec 11, 2022	Model CompressionQuantization	—Unverified
Clustering with Bregman Divergences: an Asymptotic Analysis	Dec 1, 2016	ClusteringQuantization	—Unverified
Approximately Invertible Neural Network for Learned Image Compression	Aug 30, 2024	DenoisingImage Compression	—Unverified
Adaptive Resource Allocation for Semantic Communication Networks	Dec 2, 2023	Deep Reinforcement LearningQuantization	—Unverified
Error Analysis of CORDIC Processor with FPGA Implementation	Aug 2, 2023	Quantization	—Unverified
ERQ: Error Reduction for Post-Training Quantization of Vision Transformers	Jul 9, 2024	Quantizationregression	—Unverified
E-RNN: Design Optimization for Efficient Recurrent Neural Networks in FPGAs	Dec 12, 2018	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Clustering-Based Evolutionary Federated Multiobjective Optimization and Learning	Apr 29, 2025	ClusteringDiversity	—Unverified
Approximate DCT and Quantization Techniques for Energy-Constrained Image Sensors	Jun 24, 2024	Quantization	—Unverified
Cluster-Based Cooperative Digital Over-the-Air Aggregation for Wireless Federated Edge Learning	Aug 3, 2020	DecoderDiversity	—Unverified
EQ-Net: A Unified Deep Learning Framework for Log-Likelihood Ratio Estimation and Quantization	Dec 23, 2020	GPUQuantization	—Unverified
ClusComp: A Simple Paradigm for Model Compression and Efficient Finetuning	Mar 17, 2025	GPUModel Compression	—Unverified
Approaching Rate-Distortion Limits in Neural Compression with Lattice Transform Coding	Mar 12, 2024	Quantization	—Unverified
Adaptive Resolution Inference (ARI): Energy-Efficient Machine Learning for Internet of Things	Aug 26, 2024	Quantization	—Unverified
Accelerating Energy-Efficient Federated Learning in Cell-Free Networks with Adaptive Quantization	Dec 30, 2024	Federated LearningQuantization	—Unverified
2-in-1 Accelerator: Enabling Random Precision Switch for Winning Both Adversarial Robustness and Efficiency	Sep 11, 2021	Adversarial RobustnessQuantization	—Unverified
EPIM: Efficient Processing-In-Memory Accelerators based on Epitome	Nov 12, 2023	Model CompressionNeural Architecture Search	—Unverified
EoRA: Training-free Compensation for Compressed LLM with Eigenspace Low-Rank Approximation	Oct 28, 2024	ARCMath	—Unverified
Entropy optimized semi-supervised decomposed vector-quantized variational autoencoder model based on transfer learning for multiclass text classification and generation	Nov 10, 2021	DecoderMulti Class Text Classification	—Unverified
CLIP-Q: Deep Network Compression Learning by In-Parallel Pruning-Quantization	Jun 1, 2018	image-classificationImage Classification	—Unverified
Entropy-Driven Mixed-Precision Quantization for Deep Network Design	Nov 28, 2022	CPUFace Detection	—Unverified
Entropy Coding Improvement for Low-complexity Compressive Auto-encoders	Mar 10, 2023	QuantizationVideo Compression	—Unverified

Show:10 25 50

← PrevPage 88 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified