Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1551–1575 of 4925 papers

Title	Date	Tasks	Status
End-to-End Optimized Speech Coding with Deep Neural Networks	Oct 25, 2017	CPUFeature Engineering	—Unverified
End-to-end Quantized Training via Log-Barrier Extensions	Jan 1, 2021	Quantization	—Unverified
End-to-End Rate-Distortion Optimization for Bi-Directional Learned Video Compression	Aug 11, 2020	Motion EstimationQuantization	—Unverified
An Implementation of Vector Quantization using the Genetic Algorithm Approach	Feb 16, 2021	ArticlesBIG-bench Machine Learning	—Unverified
EDAS: Efficient and Differentiable Architecture Search	Dec 3, 2019	GPUNeural Architecture Search	—Unverified
Adaptive Asymmetric Label-guided Hashing for Multimedia Search	Jul 26, 2022	Cross-Modal RetrievalQuantization	—Unverified
Energy-Aware LLMs: A step towards sustainable AI for downstream applications	Mar 22, 2025	Quantization	—Unverified
Energy awareness in low precision neural networks	Feb 6, 2022	Quantization	—Unverified
Energy Efficiency Maximization Precoding for Quantized Massive MIMO Systems	Aug 6, 2021	Quantization	—Unverified
Energy Efficiency Optimization for Millimeter Wave System with Resolution-Adaptive ADCs	May 18, 2020	Quantization	—Unverified
Energy-Efficient Distributed Learning Algorithms for Coarsely Quantized Signals	Jan 13, 2021	parameter estimationQuantization	—Unverified
Energy-efficient Knowledge Distillation for Spiking Neural Networks	Jun 14, 2021	Knowledge DistillationModel Compression	—Unverified
Energy Efficient Learning with Low Resolution Stochastic Domain Wall Synapse Based Deep Neural Networks	Nov 14, 2021	Quantization	—Unverified
Energy-Efficient Respiratory Anomaly Detection in Premature Newborn Infants	Feb 21, 2022	Anomaly DetectionModel Selection	—Unverified
Energy-Efficient Transformer Inference: Optimization Strategies for Time Series Classification	Feb 23, 2025	ClassificationInference Optimization	—Unverified
Engineering the Neural Automatic Passenger Counter	Mar 2, 2022	Quantization	—Unverified
ECG Biometric Authentication Using Self-Supervised Learning for IoT Edge Sensors	Sep 9, 2024	Contrastive LearningCPU	—Unverified
Enhanced Bayesian Compression via Deep Reinforcement Learning	Jun 1, 2019	Deep Reinforcement LearningQuantization	—Unverified
BlueLM-V-3B: Algorithm and System Co-Design for Multimodal Large Language Models on Mobile Devices	Nov 16, 2024	Quantization	—Unverified
Single-path Bit Sharing for Automatic Loss-aware Model Compression	Jan 13, 2021	Model CompressionNetwork Pruning	—Unverified
Fast binary embeddings, and quantized compressed sensing with structured matrices	Jan 26, 2018	compressed sensingQuantization	—Unverified
Enhancement Of Coded Speech Using a Mask-Based Post-Filter	Oct 12, 2020	DecoderQuantization	—Unverified
Fast, Compact, and High Quality LSTM-RNN Based Statistical Parametric Speech Synthesizers for Mobile Devices	Jun 20, 2016	QuantizationSpeech Synthesis	—Unverified
Block-Wise Dynamic-Precision Neural Network Training Acceleration via Online Quantization Sensitivity Analytics	Oct 31, 2022	QuantizationSensitivity	—Unverified
Reclaiming Residual Knowledge: A Novel Paradigm to Low-Bit Quantization	Aug 1, 2024	Quantization	—Unverified

Show:10 25 50

← PrevPage 63 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified