Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3726–3750 of 4925 papers

Title	Date	Tasks	Status
Attention-aware Post-training Quantization without Backpropagation	Jun 19, 2024	Quantization	—Unverified
Attention based on-device streaming speech recognition with large speech corpus	Jan 2, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Attention-based Transducer for Online Speech Recognition	May 18, 2020	CPUDecoder	—Unverified
Attention or Convolution: Transformer Encoders in Audio Language Models for Inference Efficiency	Nov 5, 2023	Quantization	—Unverified
Attention Round for Post-Training Quantization	Jul 7, 2022	Combinatorial OptimizationQuantization	—Unverified
Attentive One-Dimensional Heatmap Regression for Facial Landmark Detection and Tracking	Apr 5, 2020	Face AlignmentFacial Landmark Detection	—Unverified
Attribute Artifacts Removal for Geometry-based Point Cloud Compression	Dec 1, 2021	AttributeGraph Attention	—Unverified
Augmented Deep Unfolding for Downlink Beamforming in Multi-cell Massive MIMO With Limited Feedback	Sep 3, 2022	Quantization	—Unverified
Combining Multi-Objective Bayesian Optimization with Reinforcement Learning for TinyML	May 23, 2023	Bayesian OptimizationHyperparameter Optimization	—Unverified
Augmenting Hessians with Inter-Layer Dependencies for Mixed-Precision Post-Training Quantization	Jun 8, 2023	Quantization	—Unverified
A Unified Compression Framework for Efficient Speech-Driven Talking-Face Generation	Apr 2, 2023	Face GenerationKnowledge Distillation	—Unverified
A Unified Framework of DNN Weight Pruning and Weight Clustering/Quantization Using ADMM	Nov 5, 2018	ClusteringModel Compression	—Unverified
A Unified Theory of SGD: Variance Reduction, Sampling, Quantization and Coordinate Descent	May 27, 2019	Quantization	—Unverified
A Unified View of Delta Parameter Editing in Post-Trained Large-Scale Models	Oct 17, 2024	Quantization	—Unverified
AUSN: Approximately Uniform Quantization by Adaptively Superimposing Non-uniform Distribution for Deep Neural Networks	Jul 8, 2020	image-classificationImage Classification	—Unverified
Autoencoder-Based Error Correction Coding for One-Bit Quantization	Sep 24, 2019	Quantization	—Unverified
Autoencoder based image compression: can the learning be quantization independent?	Feb 23, 2018	Image CompressionQuantization	—Unverified
Automated Backend-Aware Post-Training Quantization	Mar 27, 2021	CPUDiversity	—Unverified
Automated design of error-resilient and hardware-efficient deep neural networks	Sep 30, 2019	Autonomous VehiclesQuantization	—Unverified
Automated flow for compressing convolution neural networks for efficient edge-computation with FPGA	Dec 18, 2017	CPUobject-detection	—Unverified
Automated Heterogeneous Low-Bit Quantization of Multi-Model Deep Learning Inference Pipeline	Nov 10, 2023	Ensemble LearningMulti-Task Learning	—Unverified
Automated Linear-Time Detection and Quality Assessment of Superpixels in Uncalibrated True- or False-Color RGB Images	Jan 8, 2017	Color ConstancyComputational Efficiency	—Unverified
Automated Log-Scale Quantization for Low-Cost Deep Neural Networks	Jun 19, 2021	Image EnhancementQuantization	—Unverified
Automated Model Compression by Jointly Applied Pruning and Quantization	Nov 12, 2020	AutoMLModel Compression	—Unverified
Automated Tomato Maturity Estimation Using an Optimized Residual Model with Pruning and Quantization Techniques	Mar 13, 2025	ClassificationComputational Efficiency	—Unverified

Show:10 25 50

← PrevPage 150 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified