Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3751–3800 of 4925 papers

Title	Date	Tasks	Status
Automatic Gain Control Design for Dynamic Visible Light Communication Systems	Jul 31, 2020	Quantization	—Unverified
Automatic low-bit hybrid quantization of neural networks through meta learning	Apr 24, 2020	Meta-LearningQuantization	—Unverified
Automatic mixed precision for optimizing gained time with constrained loss mean-squared-error based on model partition to sequential sub-graphs	May 19, 2025	QuantizationSensitivity	—Unverified
Automatic Mixed-Precision Quantization Search of BERT	Dec 30, 2021	Knowledge DistillationModel Compression	—Unverified
Automatic Network Adaptation for Ultra-Low Uniform-Precision Quantization	Dec 21, 2022	Neural Architecture SearchQuantization	—Unverified
Automatic Parameter Tying in Neural Networks	Jan 1, 2018	L2 RegularizationNeural Network Compression	—Unverified
Automatic Pruning for Quantized Neural Networks	Feb 3, 2020	Bayesian OptimizationQuantization	—Unverified
Automating Nearest Neighbor Search Configuration with Constrained Optimization	Jan 4, 2023	Quantization	—Unverified
AutoMixQ: Self-Adjusting Quantization for High Performance Memory-Efficient Fine-Tuning	Nov 21, 2024	Quantization	—Unverified
Automotive Radar Sensing with Sparse Linear Arrays Using One-Bit Hankel Matrix Completion	Dec 9, 2023	Matrix CompletionQuantization	—Unverified
AutoQ: Automated Kernel-Wise Neural Network Quantization	Feb 15, 2019	AutoMLDeep Reinforcement Learning	—Unverified
AutoQNN: An End-to-End Framework for Automatically Quantizing Neural Networks	Apr 7, 2023	Neural Architecture SearchQuantization	—Unverified
Autoregressive High-Order Finite Difference Modulo Imaging: High-Dynamic Range for Computer Vision Applications	Apr 5, 2025	Autonomous DrivingImage Reconstruction	—Unverified
Auto-regressive Image Synthesis with Integrated Quantization	Jul 21, 2022	Conditional Image GenerationImage Generation	—Unverified
Autoregressive Sign Language Production: A Gloss-Free Approach with Discrete Representations	Sep 21, 2023	QuantizationSign Language Production	—Unverified
Autoregressive Speech Synthesis without Vector Quantization	Jul 11, 2024	Audio CompressionDiversity	—Unverified
Auto-tuning Neural Network Quantization Framework for Collaborative Inference Between the Cloud and Edge	Dec 16, 2018	Collaborative InferenceQuantization	—Unverified
Auto-ViT-Acc: An FPGA-Aware Automatic Acceleration Framework for Vision Transformer with Mixed-Scheme Quantization	Aug 10, 2022	Quantization	—Unverified
Avaliação do método dialético na quantização de imagens multiespectrais	Dec 3, 2017	PhilosophyQuantization	—Unverified
A Video Coding Method Based on Neural Network for CLIC2024	Jan 8, 2024	Deep LearningQuantization	—Unverified
A Vision System for Multi-View Face Recognition	Jun 1, 2017	Face RecognitionQuantization	—Unverified
A Wave is Worth 100 Words: Investigating Cross-Domain Transferability in Time Series	Dec 1, 2024	ImputationQuantization	—Unverified
AWEQ: Post-Training Quantization with Activation-Weight Equalization for Large Language Models	Nov 2, 2023	Quantization	—Unverified
A White Paper on Neural Network Quantization	Jun 15, 2021	Quantization	—Unverified
AWP: Activation-Aware Weight Pruning and Quantization with Projected Gradient Descent	Jun 11, 2025	Model CompressionQuantization	—Unverified
Background Modelling using Octree Color Quantization	Dec 5, 2014	Quantization	—Unverified
Back to Simplicity: How to Train Accurate BNNs from Scratch?	Jun 19, 2019	Quantization	—Unverified
Bag of Tricks with Quantized Convolutional Neural Networks for image classification	Mar 13, 2023	image-classificationImage Classification	—Unverified
Balanced Quantization: An Effective and Efficient Approach to Quantized Neural Networks	Jun 22, 2017	Quantization	—Unverified
Balance of Number of Embedding and their Dimensions in Vector Quantization	Jul 6, 2024	Quantization	—Unverified
Balancing Robustness and Efficiency in Embedded DNNs Through Activation Function Selection	Apr 7, 2025	Autonomous DrivingDecoder	—Unverified
BAMSProd: A Step towards Generalizing the Adaptive Optimization Methods to Deep Binary Model	Sep 29, 2020	Quantization	—Unverified
Bandlimited signal reconstruction from leaky integrate-and-fire encoding using POCS	Jan 9, 2022	QuantizationRetrieval	—Unverified
Bandwidth-efficient Inference for Neural Image Compression	Sep 6, 2023	Data CompressionImage Compression	—Unverified
Bang for the Buck: Vector Search on Cloud CPUs	May 12, 2025	CPUQuantization	—Unverified
BasedAI: A decentralized P2P network for Zero Knowledge Large Language Models (ZK-LLMs)	Mar 1, 2024	Language ModelingLanguage Modelling	—Unverified
BasisConv: A method for compressed representation and learning in CNNs	Jun 11, 2019	Quantization	—Unverified
Bayesian-LoRA: LoRA based Parameter Efficient Fine-Tuning using Optimal Quantization levels and Rank Values trough Differentiable Bayesian Gates	Jun 18, 2024	parameter-efficient fine-tuningQuantization	—Unverified
Bayes Merging of Multiple Vocabularies for Scalable Image Retrieval	Mar 3, 2014	Image RetrievalQuantization	—Unverified
b-bit Marginal Regression	Dec 1, 2015	Quantizationregression	—Unverified
BBQRec: Behavior-Bind Quantization for Multi-Modal Sequential Recommendation	Apr 9, 2025	QuantizationRecommendation Systems	—Unverified
BDD4BNN: A BDD-based Quantitative Analysis Framework for Binarized Neural Networks	Mar 12, 2021	Quantization	—Unverified
BdSLW401: Transformer-Based Word-Level Bangla Sign Language Recognition Using Relative Quantization Encoding (RQE)	Mar 4, 2025	QuantizationSign Language Recognition	—Unverified
BeamVQ: Aligning Space-Time Forecasting Model via Self-training on Physics-aware Metrics	May 27, 2024	DecoderQuantization	—Unverified
BEAST: Efficient Tokenization of B-Splines Encoded Action Sequences for Imitation Learning	Jun 6, 2025	continuous-controlContinuous Control	—Unverified
BELT:Bootstrapping Electroencephalography-to-Language Decoding and Zero-Shot Sentiment Classification by Natural Language Supervision	Sep 21, 2023	Brain DecodingContrastive Learning	—Unverified
Benchmarking CFAR and CNN-based Peak Detection Algorithms in ISAC under Hardware Impairments	May 16, 2025	BenchmarkingIntegrated sensing and communication	—Unverified
Benchmarking quantized LLaMa-based models on the Brazilian Secondary School Exam	Sep 21, 2023	BenchmarkingComputational Efficiency	—Unverified
Benchmarking the Reliability of Post-training Quantization: a Particular Focus on Worst-case Performance	Mar 23, 2023	BenchmarkingData Augmentation	—Unverified
Benchmarking the Robustness of Quantized Models	Apr 8, 2023	BenchmarkingQuantization	—Unverified

Show:10 25 50

← PrevPage 76 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified