Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4651–4675 of 4925 papers

Title	Date	Tasks	Status
Characterizing and Understanding the Behavior of Quantized Models for Reliable Deployment	Apr 8, 2022	Image to textLanguage Modeling	CodeCode Available
Parameter Efficient Fine Tuning Llama 3.1 for Answering Arabic Legal Questions: A Case Study on Jordanian Laws	Jun 2, 2025	Language ModelingLanguage Modelling	CodeCode Available
Variational quantization for state space models	Apr 17, 2024	QuantizationState Space Models	CodeCode Available
Weakly Supervised Deep Hyperspherical Quantization for Image Retrieval	Apr 7, 2024	Image RetrievalQuantization	CodeCode Available
TernaryBERT: Distillation-aware Ultra-low Bit BERT	Sep 27, 2020	Knowledge DistillationQuantization	CodeCode Available
Efficient Document Retrieval by End-to-End Refining and Quantizing BERT Embedding with Contrastive Product Quantization	Oct 31, 2022	QuantizationRetrieval	CodeCode Available
Forward and Backward Information Retention for Accurate Binary Neural Networks	Sep 24, 2019	BinarizationNeural Network Compression	CodeCode Available
IR2Net: Information Restriction and Information Recovery for Accurate Binary Neural Networks	Oct 6, 2022	BinarizationQuantization	CodeCode Available
Characteristics of networks generated by kernel growing neural gas	Aug 16, 2023	ClusteringQuantization	CodeCode Available
Recurrent Neural Networks With Limited Numerical Precision	Nov 21, 2016	Quantization	CodeCode Available
Recursive CSI Quantization of Time-Correlated MIMO Channels by Deep Learning Classification	Sep 28, 2020	General ClassificationQuantization	CodeCode Available
An asymmetric heuristic for trained ternary quantization based on the statistics of the weights: an application to medical signal classification	Nov 9, 2024	Quantization	CodeCode Available
Partition Map-Based Fast Block Partitioning for VVC Inter Coding	Apr 25, 2025	Quantization	CodeCode Available
RedBit: An End-to-End Flexible Framework for Evaluating the Accuracy of Quantized CNNs	Jan 15, 2023	Quantization	CodeCode Available
Investigating the Impact of Quantization Methods on the Safety and Reliability of Large Language Models	Feb 18, 2025	Quantization	CodeCode Available
Rediscovering Hashed Random Projections for Efficient Quantization of Contextualized Sentence Embeddings	Mar 13, 2023	QuantizationSentence	CodeCode Available
Integrated Encoding and Quantization to Enhance Quanvolutional Neural Networks	Oct 8, 2024	QuantizationQuantum Machine Learning	CodeCode Available
Model Compression with Adversarial Robustness: A Unified Optimization Framework	Feb 10, 2019	Adversarial RobustnessModel Compression	CodeCode Available
Patch-Wise Spatial-Temporal Quality Enhancement for HEVC Compressed Video	Jul 8, 2021	QuantizationVideo Enhancement	CodeCode Available
Trainable pruned ternary quantization for medical signal classification models	Oct 1, 2024	Model CompressionQuantization	CodeCode Available
Deep Compressive Autoencoder for Action Potential Compression in Large-Scale Neural Recording	Sep 14, 2018	QuantizationSpike Sorting	CodeCode Available
Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding	Oct 1, 2015	CPUGPU	CodeCode Available
Patient-Level Anatomy Meets Scanning-Level Physics: Personalized Federated Low-Dose CT Denoising Empowered by Large Language Model	Mar 2, 2025	AnatomyDenoising	CodeCode Available
Integral Human Pose Regression	Nov 22, 2017	3D Human Pose Estimation3D Pose Estimation	CodeCode Available
Constructing Energy-efficient Mixed-precision Neural Networks through Principal Component Analysis for Edge Intelligence	Jun 4, 2019	Autonomous VehiclesDimensionality Reduction	CodeCode Available

Show:10 25 50

← PrevPage 187 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified