Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1301–1350 of 4925 papers

Title	Date	Tasks	Status	Score
Detecting Adversarial Image Examples in Deep Networks with Adaptive Noise Reduction	May 23, 2017	Quantization	CodeCode Available	5
Hybrid Binary Networks: Optimizing for Accuracy, Efficiency and Memory	Apr 11, 2018	BinarizationModel Compression	CodeCode Available	5
Hybrid coarse-fine classification for head pose estimation	Jan 21, 2019	3D ReconstructionClassification	CodeCode Available	5
HyperFlow: Representing 3D Objects as Surfaces	Jun 15, 2020	Autonomous DrivingObject	CodeCode Available	5
Identifying and Clustering Counter Relationships of Team Compositions in PvP Games for Efficient Balance Analysis	Aug 30, 2024	Card GamesGame Design	CodeCode Available	5
Improved Gradient based Adversarial Attacks for Quantized Networks	Mar 30, 2020	image-classificationImage Classification	CodeCode Available	5
Homology-constrained vector quantization entropy regularizer	Nov 25, 2022	Quantization	CodeCode Available	5
High-Accuracy Low-Precision Training	Mar 9, 2018	CPUQuantization	CodeCode Available	5
A Model for Every User and Budget: Label-Free and Personalized Mixed-Precision Quantization	Jul 24, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Highly Optimized Kernels and Fine-Grained Codebooks for LLM Inference on Arm CPUs	Dec 23, 2024	Quantization	CodeCode Available	5
HOT: Hadamard-based Optimized Training	Mar 27, 2025	Quantization	CodeCode Available	5
A Mixed Quantization Network for Computationally Efficient Mobile Inverse Tone Mapping	Mar 12, 2022	inverse tone mappingInverse-Tone-Mapping	CodeCode Available	5
Hierarchical Encoding of Sequential Data With Compact and Sub-Linear Storage Cost	Oct 1, 2019	QuantizationSimultaneous Localization and Mapping	CodeCode Available	5
Hierarchical Quantized Representations for Script Generation	Aug 28, 2018	DecoderLanguage Modeling	CodeCode Available	5
BatchQuant: Quantized-for-all Architecture Search with Robust Quantizer	May 19, 2021	AllGPU	CodeCode Available	5
HERO: Hessian-Enhanced Robust Optimization for Unifying and Improving Generalization and Quantization Performance	Nov 23, 2021	Quantization	CodeCode Available	5
BinaryRelax: A Relaxation Approach For Training Deep Neural Networks With Quantized Weights	Jan 19, 2018	Quantization	CodeCode Available	5
An efficient and straightforward online quantization method for a data stream through remove-birth updating	Jun 21, 2023	Drift DetectionQuantization	CodeCode Available	5
Depthwise Discrete Representation Learning	Apr 11, 2020	QuantizationRepresentation Learning	CodeCode Available	5
BASQ: Branch-wise Activation-clipping Search Quantization for Sub-4-bit Neural Networks	Oct 23, 2022	Neural Architecture SearchQuantization	CodeCode Available	5
Hessian Aware Quantization of Spiking Neural Networks	Apr 29, 2021	Quantization	CodeCode Available	5
Improved Knowledge Distillation for Crowd Counting on IoT Device	Aug 2, 2023	Crowd CountingKnowledge Distillation	CodeCode Available	5
LoTA-QAF: Lossless Ternary Adaptation for Quantization-Aware Fine-Tuning	May 24, 2025	Computational EfficiencyMMLU	CodeCode Available	5
DNN Feature Map Compression using Learned Representation over GF(2)	Aug 15, 2018	Dimensionality ReductionGeneral Classification	CodeCode Available	5
Low-bit Quantization for Deep Graph Neural Networks with Smoothness-aware Message Propagation	Aug 29, 2023	Graph Neural NetworkNode Classification	CodeCode Available	5
Harnessing Large Language Models Locally: Empirical Results and Implications for AI PC	May 21, 2025	CPUQuantization	CodeCode Available	5
Hardening DNNs against Transfer Attacks during Network Compression using Greedy Adversarial Pruning	Jun 15, 2022	Adversarial RobustnessQuantization	CodeCode Available	5
Hardware Acceleration for Real-Time Wildfire Detection Onboard Drone Networks	Jan 16, 2024	Classificationimage-classification	CodeCode Available	5
Denoising Noisy Neural Networks: A Bayesian Approach with Compensation	May 22, 2021	DenoisingQuantization	CodeCode Available	5
GT-SVQ: A Linear-Time Graph Transformer for Node Classification Using Spiking Vector Quantization	Apr 16, 2025	Graph LearningGraph Representation Learning	CodeCode Available	5
Guetzli: Perceptually Guided JPEG Encoder	Mar 13, 2017	Perceptual DistanceQuantization	CodeCode Available	5
GSB: Group Superposition Binarization for Vision Transformer with Limited Training Samples	May 13, 2023	BinarizationKnowledge Distillation	CodeCode Available	5
GraNNite: Enabling High-Performance Execution of Graph Neural Networks on Resource-Constrained Neural Processing Units	Feb 10, 2025	Event-based visionQuantization	CodeCode Available	5
A Mean Field Theory of Quantized Deep Networks: The Quantization-Depth Trade-Off	Jun 3, 2019	Quantization	CodeCode Available	5
GQFedWAvg: Optimization-Based Quantized Federated Learning in General Edge Computing Systems	Jun 13, 2023	Edge-computingFederated Learning	CodeCode Available	5
HDRUNet: Single Image HDR Reconstruction with Denoising and Dequantization	May 27, 2021	DecoderDenoising	CodeCode Available	5
FTBNN: Rethinking Non-linearity for 1-bit CNNs and Going Beyond	Oct 19, 2020	Image ClassificationQuantization	CodeCode Available	5
GIFT-SW: Gaussian noise Injected Fine-Tuning of Salient Weights for LLMs	Aug 27, 2024	parameter-efficient fine-tuningQuantization	CodeCode Available	5
Genie: Show Me the Data for Quantization	Dec 9, 2022	Data Free QuantizationQuantization	CodeCode Available	5
Deep Triplet Quantization	Feb 1, 2019	Deep HashingImage Retrieval	CodeCode Available	5
Deep Task-Based Analog-to-Digital Conversion	Jan 29, 2022	Meta-LearningQuantization	CodeCode Available	5
DoReFa-Net: Training Low Bitwidth Convolutional Neural Networks with Low Bitwidth Gradients	Jun 20, 2016	CPUGPU	CodeCode Available	5
Goten: GPU-Outsourcing Trusted Execution of Neural Network Training and Prediction	Sep 25, 2019	GPUPrivacy Preserving	CodeCode Available	5
Bag of Tricks for Optimizing Transformer Efficiency	Sep 9, 2021	CPUDecoder	CodeCode Available	5
DeepShift: Towards Multiplication-Less Neural Networks	May 30, 2019	Edge-computingGPU	CodeCode Available	5
General Point Model Pretraining with Autoencoding and Autoregressive	Jan 1, 2024	DecoderLanguage Modeling	CodeCode Available	5
Deep reverse tone mapping	Nov 20, 2017	inverse tone mappingQuantization	CodeCode Available	5
Generalized Relevance Learning Grassmann Quantization	Mar 14, 2024	Activity RecognitionFace Recognition	CodeCode Available	5
Deep residual network for steganalysis of digital images	Sep 23, 2018	Image SteganographyQuantization	CodeCode Available	5
Deep Recurrent Quantization for Generating Sequential Binary Codes	Jun 16, 2019	Image RetrievalQuantization	CodeCode Available	5

Show:10 25 50

← PrevPage 27 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified