Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1251–1300 of 4925 papers

Title	Date	Tasks	Status	Score
Integer Quantization for Deep Learning Inference: Principles and Empirical Evaluation	Apr 20, 2020	Deep LearningMath	CodeCode Available	5
Diffusion Models as Stochastic Quantization in Lattice Field Theory	Sep 29, 2023	Quantization	CodeCode Available	5
In-Context Learning for MIMO Equalization Using Transformer-Based Sequence Models	Nov 10, 2023	In-Context LearningMeta-Learning	CodeCode Available	5
Incremental Network Quantization: Towards Lossless CNNs with Low-Precision Weights	Feb 10, 2017	Quantization	CodeCode Available	5
A Bag-of-Words Equivalent Recurrent Neural Network for Action Recognition	Mar 23, 2017	Action RecognitionGeneral Classification	CodeCode Available	5
Improving Robustness Against Stealthy Weight Bit-Flip Attacks by Output Code Matching	Jan 1, 2022	Quantization	CodeCode Available	5
Improving Neural Network Quantization without Retraining using Outlier Channel Splitting	Jan 28, 2019	Language ModelingLanguage Modelling	CodeCode Available	5
Discrete Cross-Modal Alignment Enables Zero-Shot Speech Translation	Oct 18, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Improving Self-Supervised Learning-based MOS Prediction Networks	Apr 23, 2022	PredictionQuantization	CodeCode Available	5
GLAD: Improving Latent Graph Generative Modeling with Simple Quantization	Mar 25, 2024	Quantization	CodeCode Available	5
Differentiable Soft Quantization: Bridging Full-Precision and Low-Bit Neural Networks	Aug 14, 2019	Quantization	CodeCode Available	5
Implicit Feature Decoupling with Depthwise Quantization	Mar 15, 2022	DecoderQuantization	CodeCode Available	5
Improved Gradient based Adversarial Attacks for Quantized Networks	Mar 30, 2020	image-classificationImage Classification	CodeCode Available	5
Differentiable Product Quantization for End-to-End Embedding Compression	Aug 26, 2019	Quantization	CodeCode Available	5
Improved Knowledge Distillation for Crowd Counting on IoT Device	Aug 2, 2023	Crowd CountingKnowledge Distillation	CodeCode Available	5
Differentiable Product Quantization for Memory Efficient Camera Relocalization	Jul 22, 2024	Camera RelocalizationQuantization	CodeCode Available	5
Image Hashing by Minimizing Discrete Component-wise Wasserstein Distance	Feb 29, 2020	Image RetrievalQuantization	CodeCode Available	5
ImPart: Importance-Aware Delta-Sparsification for Improved Model Compression and Merging in LLMs	Apr 17, 2025	Model CompressionQuantization	CodeCode Available	5
Benchmarking Post-Training Quantization in LLMs: Comprehensive Taxonomy, Unified Evaluation, and Comparative Analysis	Feb 18, 2025	BenchmarkingMamba	CodeCode Available	5
KP2Dtiny: Quantized Neural Keypoint Detection and Description on the Edge	Jul 7, 2023	Homography EstimationKeypoint Detection	CodeCode Available	5
Differentiable Fine-grained Quantization for Deep Neural Network Compression	Oct 20, 2018	Neural Network CompressionQuantization	CodeCode Available	5
Identifying and Clustering Counter Relationships of Team Compositions in PvP Games for Efficient Balance Analysis	Aug 30, 2024	Card GamesGame Design	CodeCode Available	5
IBVC: Interpolation-driven B-frame Video Compression	Sep 25, 2023	DecoderMotion Compensation	CodeCode Available	5
Addition is almost all you need: Compressing neural networks with double binary factorization	May 16, 2025	AllBinarization	CodeCode Available	5
HyperFlow: Representing 3D Objects as Surfaces	Jun 15, 2020	Autonomous DrivingObject	CodeCode Available	5
Hyper-Sphere Quantization: Communication-Efficient SGD for Federated Learning	Nov 12, 2019	Federated LearningQuantization	CodeCode Available	5
Investigating the Impact of Quantization Methods on the Safety and Reliability of Large Language Models	Feb 18, 2025	Quantization	CodeCode Available	5
Learning Accurate Low-Bit Deep Neural Networks with Stochastic Quantization	Aug 3, 2017	Quantization	CodeCode Available	5
Bees Local Phase Quantization Feature Selection for RGB-D Facial Expressions Recognition	Aug 3, 2023	feature selectionQuantization	CodeCode Available	5
HOT: Hadamard-based Optimized Training	Mar 27, 2025	Quantization	CodeCode Available	5
Device-friendly Guava fruit and leaf disease detection using deep learning	Sep 26, 2022	DiagnosticModel Optimization	CodeCode Available	5
Development, Optimization, and Deployment of Thermal Forward Vision Systems for Advance Vehicular Applications on Edge Devices	Jan 18, 2023	Model Optimizationobject-detection	CodeCode Available	5
Detection of Structural Change in Geographic Regions of Interest by Self Organized Mapping: Las Vegas City and Lake Mead across the Years	Mar 29, 2018	QuantizationTime Series	CodeCode Available	5
Homology-constrained vector quantization entropy regularizer	Nov 25, 2022	Quantization	CodeCode Available	5
A multimodal dynamical variational autoencoder for audiovisual speech representation learning	May 5, 2023	DenoisingDisentanglement	CodeCode Available	5
Detection of extragalactic Ultra-Compact Dwarfs and Globular Clusters using Explainable AI techniques	Jan 5, 2022	Feature ImportanceQuantization	CodeCode Available	5
High-Accuracy Low-Precision Training	Mar 9, 2018	CPUQuantization	CodeCode Available	5
BdSLW60: A Word-Level Bangla Sign Language Dataset	Feb 13, 2024	BenchmarkingGesture Recognition	CodeCode Available	5
Highly Optimized Kernels and Fine-Grained Codebooks for LLM Inference on Arm CPUs	Dec 23, 2024	Quantization	CodeCode Available	5
Learning Semantic Textual Similarity via Topic-informed Discrete Latent Variables	Nov 7, 2022	Language ModelingLanguage Modelling	CodeCode Available	5
Detecting Adversarial Image Examples in Deep Networks with Adaptive Noise Reduction	May 23, 2017	Quantization	CodeCode Available	5
Hierarchical Quantized Representations for Script Generation	Aug 28, 2018	DecoderLanguage Modeling	CodeCode Available	5
Hybrid Binary Networks: Optimizing for Accuracy, Efficiency and Memory	Apr 11, 2018	BinarizationModel Compression	CodeCode Available	5
Distributed dual vigilance fuzzy adaptive resonance theory learns online, retrieves arbitrarily-shaped clusters, and mitigates order dependence	Nov 28, 2018	ClusteringQuantization	CodeCode Available	5
HERO: Hessian-Enhanced Robust Optimization for Unifying and Improving Generalization and Quantization Performance	Nov 23, 2021	Quantization	CodeCode Available	5
HDRUNet: Single Image HDR Reconstruction with Denoising and Dequantization	May 27, 2021	DecoderDenoising	CodeCode Available	5
HEAM: High-Efficiency Approximate Multiplier Optimization for Deep Neural Networks	Jan 20, 2022	QuantizationVocal Bursts Intensity Prediction	CodeCode Available	5
Hessian Aware Quantization of Spiking Neural Networks	Apr 29, 2021	Quantization	CodeCode Available	5
Harnessing Large Language Models Locally: Empirical Results and Implications for AI PC	May 21, 2025	CPUQuantization	CodeCode Available	5
Hardware Acceleration for Real-Time Wildfire Detection Onboard Drone Networks	Jan 16, 2024	Classificationimage-classification	CodeCode Available	5

Show:10 25 50

← PrevPage 26 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified