Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1201–1250 of 4925 papers

Title	Date	Tasks	Status	Score
An efficient and straightforward online quantization method for a data stream through remove-birth updating	Jun 21, 2023	Drift DetectionQuantization	CodeCode Available	5
AdaBin: Improving Binary Neural Networks with Adaptive Binary Sets	Aug 17, 2022	Classification with Binary Neural NetworkQuantization	CodeCode Available	5
An Edge Computing-Based Solution for Real-Time Leaf Disease Classification using Thermal Imaging	Nov 6, 2024	Deep LearningEdge-computing	CodeCode Available	5
Just Round: Quantized Observation Spaces Enable Memory Efficient Learning of Dynamic Locomotion	Oct 14, 2022	Deep Reinforcement LearningQuantization	CodeCode Available	5
JPEG Inspired Deep Learning	Oct 9, 2024	Deep LearningFine-Grained Image Classification	CodeCode Available	5
A Binary Variational Autoencoder for Hashing	Oct 22, 2019	QuantizationRetrieval	CodeCode Available	5
Binarized Knowledge Graph Embeddings	Feb 8, 2019	Knowledge Graph CompletionKnowledge Graph Embeddings	CodeCode Available	5
An asymmetric heuristic for trained ternary quantization based on the statistics of the weights: an application to medical signal classification	Nov 9, 2024	Quantization	CodeCode Available	5
Bimodal Distributed Binarized Neural Networks	Apr 5, 2022	BinarizationQuantization	CodeCode Available	5
Joint Pruning and Channel-wise Mixed-Precision Quantization for Efficient Deep Neural Networks	Jul 1, 2024	Quantization	CodeCode Available	5
Activations and Gradients Compression for Model-Parallel Training	Jan 15, 2024	image-classificationImage Classification	CodeCode Available	5
Joint Maximum Purity Forest with Application to Image Super-Resolution	Aug 30, 2017	ClusteringGeneral Classification	CodeCode Available	5
Lipschitz Continuity Retained Binary Neural Network	Jul 13, 2022	BinarizationQuantization	CodeCode Available	5
I&S-ViT: An Inclusive & Stable Method for Pushing the Limit of Post-Training ViTs Quantization	Nov 16, 2023	Quantization	CodeCode Available	5
Iterative Training: Finding Binary Weight Deep Neural Networks with Layer Binarization	Nov 13, 2021	BinarizationQuantization	CodeCode Available	5
Is PGD-Adversarial Training Necessary? Alternative Training via a Soft-Quantization Network with Noisy-Natural Samples Only	Oct 10, 2018	Adversarial AttackQuantization	CodeCode Available	5
BiFeat: Supercharge GNN Training via Graph Feature Quantization	Jul 29, 2022	GPUQuantization	CodeCode Available	5
Investigating the Impact of Quantization Methods on the Safety and Reliability of Large Language Models	Feb 18, 2025	Quantization	CodeCode Available	5
IR2Net: Information Restriction and Information Recovery for Accurate Binary Neural Networks	Oct 6, 2022	BinarizationQuantization	CodeCode Available	5
Forward and Backward Information Retention for Accurate Binary Neural Networks	Sep 24, 2019	BinarizationNeural Network Compression	CodeCode Available	5
Integral Human Pose Regression	Nov 22, 2017	3D Human Pose Estimation3D Pose Estimation	CodeCode Available	5
Activation Compression of Graph Neural Networks using Block-wise Quantization with Improved Variance Minimization	Sep 21, 2023	GPUQuantization	CodeCode Available	5
Integrated Encoding and Quantization to Enhance Quanvolutional Neural Networks	Oct 8, 2024	QuantizationQuantum Machine Learning	CodeCode Available	5
Integer-Only Neural Network Quantization Scheme Based on Shift-Batch-Normalization	May 28, 2021	Quantization	CodeCode Available	5
Integer Quantization for Deep Learning Inference: Principles and Empirical Evaluation	Apr 20, 2020	Deep LearningMath	CodeCode Available	5
Beyond Product Quantization: Deep Progressive Quantization for Image Retrieval	Jun 16, 2019	Image RetrievalQuantization	CodeCode Available	5
Instance-Aware Dynamic Neural Network Quantization	Jan 1, 2022	Quantization	CodeCode Available	5
Improving Robustness Against Stealthy Weight Bit-Flip Attacks by Output Code Matching	Jan 1, 2022	Quantization	CodeCode Available	5
Improving Neural Network Quantization without Retraining using Outlier Channel Splitting	Jan 28, 2019	Language ModelingLanguage Modelling	CodeCode Available	5
Improving Self-Supervised Learning-based MOS Prediction Networks	Apr 23, 2022	PredictionQuantization	CodeCode Available	5
Improved Gradient based Adversarial Attacks for Quantized Networks	Mar 30, 2020	image-classificationImage Classification	CodeCode Available	5
Digital and Hybrid Precoding Designs in Massive MIMO with Low-Resolution ADCs	Sep 26, 2024	Quantization	CodeCode Available	5
Implicit Feature Decoupling with Depthwise Quantization	Mar 15, 2022	DecoderQuantization	CodeCode Available	5
In-Context Learning for MIMO Equalization Using Transformer-Based Sequence Models	Nov 10, 2023	In-Context LearningMeta-Learning	CodeCode Available	5
Diffusion Models as Stochastic Quantization in Lattice Field Theory	Sep 29, 2023	Quantization	CodeCode Available	5
Image Hashing by Minimizing Discrete Component-wise Wasserstein Distance	Feb 29, 2020	Image RetrievalQuantization	CodeCode Available	5
ImPart: Importance-Aware Delta-Sparsification for Improved Model Compression and Merging in LLMs	Apr 17, 2025	Model CompressionQuantization	CodeCode Available	5
IBVC: Interpolation-driven B-frame Video Compression	Sep 25, 2023	DecoderMotion Compensation	CodeCode Available	5
A Bag-of-Words Equivalent Recurrent Neural Network for Action Recognition	Mar 23, 2017	Action RecognitionGeneral Classification	CodeCode Available	5
Identifying and Clustering Counter Relationships of Team Compositions in PvP Games for Efficient Balance Analysis	Aug 30, 2024	Card GamesGame Design	CodeCode Available	5
Incremental Network Quantization: Towards Lossless CNNs with Low-Precision Weights	Feb 10, 2017	Quantization	CodeCode Available	5
Improved Knowledge Distillation for Crowd Counting on IoT Device	Aug 2, 2023	Crowd CountingKnowledge Distillation	CodeCode Available	5
Beyond Perplexity: Multi-dimensional Safety Evaluation of LLM Compression	Jul 6, 2024	Language ModelingLanguage Modelling	CodeCode Available	5
Differentiable Soft Quantization: Bridging Full-Precision and Low-Bit Neural Networks	Aug 14, 2019	Quantization	CodeCode Available	5
Hybrid coarse-fine classification for head pose estimation	Jan 21, 2019	3D ReconstructionClassification	CodeCode Available	5
Differentiable Product Quantization for End-to-End Embedding Compression	Aug 26, 2019	Quantization	CodeCode Available	5
Hybrid Binary Networks: Optimizing for Accuracy, Efficiency and Memory	Apr 11, 2018	BinarizationModel Compression	CodeCode Available	5
Differentiable Product Quantization for Memory Efficient Camera Relocalization	Jul 22, 2024	Camera RelocalizationQuantization	CodeCode Available	5
HOT: Hadamard-based Optimized Training	Mar 27, 2025	Quantization	CodeCode Available	5
HyperFlow: Representing 3D Objects as Surfaces	Jun 15, 2020	Autonomous DrivingObject	CodeCode Available	5

Show:10 25 50

← PrevPage 25 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified