Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1251–1275 of 4925 papers

Title	Date	Tasks	Status
Approximate Probabilistic Neural Networks with Gated Threshold Logic	Aug 2, 2018	General ClassificationQuantization	—Unverified
Adaptive Sample-space & Adaptive Probability coding: a neural-network based approach for compression	May 1, 2019	Data CompressionEfficient Neural Network	—Unverified
Towards Feature Distribution Alignment and Diversity Enhancement for Data-Free Quantization	Apr 30, 2022	Data Free QuantizationDiversity	—Unverified
Cluster Pruning: An Efficient Filter Pruning Method for Edge AI Vision Applications	Mar 5, 2020	CPUGPU	—Unverified
Adaptive Resource Allocation for Semantic Communication Networks	Dec 2, 2023	Deep Reinforcement LearningQuantization	—Unverified
Cluster-Promoting Quantization with Bit-Drop for Minimizing Network Quantization Loss	Sep 5, 2021	Quantization	—Unverified
Clustering with Bregman Divergences: an Asymptotic Analysis	Dec 1, 2016	ClusteringQuantization	—Unverified
Approximately Invertible Neural Network for Learned Image Compression	Aug 30, 2024	DenoisingImage Compression	—Unverified
Adaptive Resolution Inference (ARI): Energy-Efficient Machine Learning for Internet of Things	Aug 26, 2024	Quantization	—Unverified
Clustering-Based Evolutionary Federated Multiobjective Optimization and Learning	Apr 29, 2025	ClusteringDiversity	—Unverified
Approximate DCT and Quantization Techniques for Energy-Constrained Image Sensors	Jun 24, 2024	Quantization	—Unverified
Cluster-Based Cooperative Digital Over-the-Air Aggregation for Wireless Federated Edge Learning	Aug 3, 2020	DecoderDiversity	—Unverified
ClusComp: A Simple Paradigm for Model Compression and Efficient Finetuning	Mar 17, 2025	GPUModel Compression	—Unverified
Approaching Rate-Distortion Limits in Neural Compression with Lattice Transform Coding	Mar 12, 2024	Quantization	—Unverified
1-Bit Compressive Sensing for Efficient Federated Learning Over the Air	Mar 30, 2021	Compressive SensingDimensionality Reduction	—Unverified
Effective and Efficient Mixed Precision Quantization of Speech Foundation Models	Jan 7, 2025	Model Compressionparameter estimation	—Unverified
Effective Interplay between Sparsity and Quantization: From Theory to Practice	May 31, 2024	Computational EfficiencyModel Compression	—Unverified
Accelerating Deep Learning with Dynamic Data Pruning	Nov 24, 2021	AttributeDeep Learning	—Unverified
CLIP-Q: Deep Network Compression Learning by In-Parallel Pruning-Quantization	Jun 1, 2018	image-classificationImage Classification	—Unverified
Edge-MultiAI: Multi-Tenancy of Latency-Sensitive Deep Learning Applications on Edge	Nov 14, 2022	ManagementModel Compression	—Unverified
Adaptive quantization with mixed-precision based on low-cost proxy	Feb 27, 2024	Neural Architecture SearchQuantization	—Unverified
2-Bit Random Projections, NonLinear Estimators, and Approximate Near Neighbor Search	Feb 21, 2016	QuantizationRe-Ranking	—Unverified
A Post-coder Feedback Approach to Overcome Training Asymmetry in MIMO-TDD	Jul 22, 2020	Quantization	—Unverified
Click-through Rate Prediction with Auto-Quantized Contrastive Learning	Sep 27, 2021	Click-Through Rate PredictionContrastive Learning	—Unverified
Adaptive Quantization Resolution and Power Control for Federated Learning over Cell-free Networks	Dec 14, 2024	Federated LearningQuantization	—Unverified

Show:10 25 50

← PrevPage 51 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified