Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4651–4700 of 4925 papers

Title	Date	Tasks	Status
Characterizing and Understanding the Behavior of Quantized Models for Reliable Deployment	Apr 8, 2022	Image to textLanguage Modeling	CodeCode Available
Parameter Efficient Fine Tuning Llama 3.1 for Answering Arabic Legal Questions: A Case Study on Jordanian Laws	Jun 2, 2025	Language ModelingLanguage Modelling	CodeCode Available
Variational quantization for state space models	Apr 17, 2024	QuantizationState Space Models	CodeCode Available
Weakly Supervised Deep Hyperspherical Quantization for Image Retrieval	Apr 7, 2024	Image RetrievalQuantization	CodeCode Available
TernaryBERT: Distillation-aware Ultra-low Bit BERT	Sep 27, 2020	Knowledge DistillationQuantization	CodeCode Available
Efficient Document Retrieval by End-to-End Refining and Quantizing BERT Embedding with Contrastive Product Quantization	Oct 31, 2022	QuantizationRetrieval	CodeCode Available
Forward and Backward Information Retention for Accurate Binary Neural Networks	Sep 24, 2019	BinarizationNeural Network Compression	CodeCode Available
IR2Net: Information Restriction and Information Recovery for Accurate Binary Neural Networks	Oct 6, 2022	BinarizationQuantization	CodeCode Available
Characteristics of networks generated by kernel growing neural gas	Aug 16, 2023	ClusteringQuantization	CodeCode Available
Recurrent Neural Networks With Limited Numerical Precision	Nov 21, 2016	Quantization	CodeCode Available
Recursive CSI Quantization of Time-Correlated MIMO Channels by Deep Learning Classification	Sep 28, 2020	General ClassificationQuantization	CodeCode Available
An asymmetric heuristic for trained ternary quantization based on the statistics of the weights: an application to medical signal classification	Nov 9, 2024	Quantization	CodeCode Available
Partition Map-Based Fast Block Partitioning for VVC Inter Coding	Apr 25, 2025	Quantization	CodeCode Available
RedBit: An End-to-End Flexible Framework for Evaluating the Accuracy of Quantized CNNs	Jan 15, 2023	Quantization	CodeCode Available
Investigating the Impact of Quantization Methods on the Safety and Reliability of Large Language Models	Feb 18, 2025	Quantization	CodeCode Available
Rediscovering Hashed Random Projections for Efficient Quantization of Contextualized Sentence Embeddings	Mar 13, 2023	QuantizationSentence	CodeCode Available
Integrated Encoding and Quantization to Enhance Quanvolutional Neural Networks	Oct 8, 2024	QuantizationQuantum Machine Learning	CodeCode Available
Model Compression with Adversarial Robustness: A Unified Optimization Framework	Feb 10, 2019	Adversarial RobustnessModel Compression	CodeCode Available
Patch-Wise Spatial-Temporal Quality Enhancement for HEVC Compressed Video	Jul 8, 2021	QuantizationVideo Enhancement	CodeCode Available
Trainable pruned ternary quantization for medical signal classification models	Oct 1, 2024	Model CompressionQuantization	CodeCode Available
Deep Compressive Autoencoder for Action Potential Compression in Large-Scale Neural Recording	Sep 14, 2018	QuantizationSpike Sorting	CodeCode Available
Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding	Oct 1, 2015	CPUGPU	CodeCode Available
Patient-Level Anatomy Meets Scanning-Level Physics: Personalized Federated Low-Dose CT Denoising Empowered by Large Language Model	Mar 2, 2025	AnatomyDenoising	CodeCode Available
Integral Human Pose Regression	Nov 22, 2017	3D Human Pose Estimation3D Pose Estimation	CodeCode Available
Constructing Energy-efficient Mixed-precision Neural Networks through Principal Component Analysis for Edge Intelligence	Jun 4, 2019	Autonomous VehiclesDimensionality Reduction	CodeCode Available
DeepCABAC: A Universal Compression Algorithm for Deep Neural Networks	Jul 27, 2019	Neural Network CompressionQuantization	CodeCode Available
Integer Quantization for Deep Learning Inference: Principles and Empirical Evaluation	Apr 20, 2020	Deep LearningMath	CodeCode Available
Integer-Only Neural Network Quantization Scheme Based on Shift-Batch-Normalization	May 28, 2021	Quantization	CodeCode Available
Efficient Deployment of Spiking Neural Networks on SpiNNaker2 for DVS Gesture Recognition Using Neuromorphic Intermediate Representation	Sep 4, 2025	Edge-computingGesture Recognition	CodeCode Available
Instance-Aware Dynamic Neural Network Quantization	Jan 1, 2022	Quantization	CodeCode Available
Perceptual Quality Assessment of Trisoup-Lifting Encoded 3D Point Clouds	Oct 9, 2024	Point Cloud Quality AssessmentQuantization	CodeCode Available
SNN4Agents: A Framework for Developing Energy-Efficient Embodied Spiking Neural Networks for Autonomous Agents	Apr 14, 2024	Quantization	CodeCode Available
Fast Point Cloud Geometry Compression with Context-based Residual Coding and INR-based Refinement	Aug 6, 2024	Quantization	CodeCode Available
Reducing Inference Energy Consumption Using Dual Complementary CNNs	Dec 2, 2024	Quantization	CodeCode Available
A Transfer Learning and Explainable Solution to Detect mpox from Smartphones images	May 29, 2023	image-classificationImage Classification	CodeCode Available
Reducing Storage of Pretrained Neural Networks by Rate-Constrained Quantization and Entropy Coding	May 24, 2025	Quantization	CodeCode Available
Ternary Singular Value Decomposition as a Better Parameterized Form in Linear Mapping	Aug 15, 2023	FormLanguage Modeling	CodeCode Available
Performance, Power, and Area Design Trade-offs in Millimeter-Wave Transmitter Beamforming Architectures	Jul 19, 2018	Quantization	CodeCode Available
Incremental Network Quantization: Towards Lossless CNNs with Low-Precision Weights	Feb 10, 2017	Quantization	CodeCode Available
A Tale of Two Models: Constructing Evasive Attacks on Edge Models	Apr 22, 2022	QuantizationVocal Bursts Valence Prediction	CodeCode Available
Trained Quantization Thresholds for Accurate and Efficient Fixed-Point Inference of Deep Neural Networks	Mar 19, 2019	Quantization	CodeCode Available
A multimodal dynamical variational autoencoder for audiovisual speech representation learning	May 5, 2023	DenoisingDisentanglement	CodeCode Available
Refining a k-nearest neighbor graph for a computationally efficient spectral clustering	Feb 22, 2023	ClusteringComputational Efficiency	CodeCode Available
In-Context Learning for MIMO Equalization Using Transformer-Based Sequence Models	Nov 10, 2023	In-Context LearningMeta-Learning	CodeCode Available
Refining a -nearest neighbor graph for a computationally efficient spectral clustering	Feb 6, 2021	ClusteringComputational Efficiency	CodeCode Available
Physics-Conditioned Diffusion Models for Lattice Gauge Theory	Feb 8, 2025	Quantization	CodeCode Available
Physics Inspired Criterion for Pruning-Quantization Joint Learning	Dec 1, 2023	image-classificationImage Classification	CodeCode Available
Deep attention-based classification network for robust depth prediction	Jul 11, 2018	ClassificationDeep Attention	CodeCode Available
Picking Up Quantization Steps for Compressed Image Classification	Apr 21, 2023	Classificationimage-classification	CodeCode Available
Soft Quantization using Entropic Regularization	Sep 8, 2023	Quantization	CodeCode Available

Show:10 25 50

← PrevPage 94 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified