Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1451–1475 of 4925 papers

Title	Date	Tasks	Status
EQ-Net: A Unified Deep Learning Framework for Log-Likelihood Ratio Estimation and Quantization	Dec 23, 2020	GPUQuantization	—Unverified
Efficient Discrete Supervised Hashing for Large-scale Cross-modal Retrieval	May 3, 2019	Cross-Modal RetrievalQuantization	—Unverified
Error Analysis of CORDIC Processor with FPGA Implementation	Aug 2, 2023	Quantization	—Unverified
Efficient Distributed Training through Gradient Compression with Sparsification and Quantization Techniques	Dec 7, 2024	Quantization	—Unverified
Estimation and Quantization of Expected Persistence Diagrams	May 11, 2021	QuantizationTime Series	—Unverified
Event-Triggered Quantized Average Consensus via Mass Summation	Mar 27, 2020	Quantization	—Unverified
BTEL: A Binary Tree Encoding Approach for Visual Localization	Jun 27, 2019	Image RetrievalQuantization	—Unverified
Efficient Error-Tolerant Quantized Neural Network Accelerators	Dec 16, 2019	QuantizationScheduling	—Unverified
Efficient Evaluation of Quantization-Effects in Neural Codecs	Feb 7, 2025	DecoderQuantization	—Unverified
Efficient Execution of Quantized Deep Learning Models: A Compiler Approach	Jun 18, 2020	CPUDeep Learning	—Unverified
Bullion: A Column Store for Machine Learning	Apr 13, 2024	QuantizationRecommendation Systems	—Unverified
Efficient Federated Learning over Multiple Access Channel with Differential Privacy Constraints	May 15, 2020	Federated LearningQuantization	—Unverified
Efficient Fine-Tuning of Quantized Models via Adaptive Rank and Bitwidth	May 2, 2025	GSM8KQuantization	—Unverified
Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats	Apr 4, 2025	Cloud DetectionQuantization	—Unverified
Efficient Generative Modeling with Residual Vector Quantization-Based Tokens	Dec 13, 2024	Conditional Image GenerationImage Generation	—Unverified
Efficient Hardware Implementation of Incremental Learning and Inference on Chip	Nov 18, 2019	CPUIncremental Learning	—Unverified
Edge Intelligence Optimization for Large Language Model Inference with Batching and Quantization	May 12, 2024	Language ModelingLanguage Modelling	—Unverified
Efficient Hybrid Network Architectures for Extremely Quantized Neural Networks Enabling Intelligence at the Edge	Feb 1, 2019	Edge-computingQuantization	—Unverified
Edge Inference with Fully Differentiable Quantized Mixed Precision Neural Networks	Jun 15, 2022	Edge-computingQuantization	—Unverified
Efficient Inference via Universal LSH Kernel	Jun 21, 2021	Knowledge DistillationQuantization	—Unverified
Boost CTR Prediction for New Advertisements via Modeling Visual Content	Sep 23, 2022	Click-Through Rate PredictionPrediction	—Unverified
EdgeFusion: On-Device Text-to-Image Generation	Apr 18, 2024	Image GenerationKnowledge Distillation	—Unverified
Edge-Enabled Real-time Railway Track Segmentation	Jan 21, 2024	GPUQuantization	—Unverified
Efficient Large-Scale Approximate Nearest Neighbor Search on OpenCL FPGA	Jun 1, 2018	CPUGPU	—Unverified
BOMP-NAS: Bayesian Optimization Mixed Precision NAS	Jan 27, 2023	Bayesian OptimizationNeural Architecture Search	—Unverified

Show:10 25 50

← PrevPage 59 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified