Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2351–2400 of 4925 papers

Title	Date	Tasks	Status
A comprehensive review of Binary Neural Network	Oct 11, 2021	BinarizationQuantization	—Unverified
Interest Point Detection based on Adaptive Ternary Coding	Dec 31, 2018	Face RecognitionInterest Point Detection	—Unverified
Joint Neural Architecture Search and Quantization	Nov 23, 2018	Model CompressionNeural Architecture Search	—Unverified
Joint Optimization of Rate, Distortion, and Decoding Energy for HEVC Intraframe Coding	Mar 3, 2022	DecoderQuantization	—Unverified
Modified Vector Quantization for Small-Cell Access Point Placement with Inter-Cell Interference	Nov 5, 2020	FairnessQuantization	—Unverified
Bang for the Buck: Vector Search on Cloud CPUs	May 12, 2025	CPUQuantization	—Unverified
Interactions Across Blocks in Post-Training Quantization of Large Language Models	Nov 6, 2024	Quantization	—Unverified
Joint Quantization and Pruning Neural Networks Approach: A Case Study on FSO Receivers	Jun 25, 2025	Quantization	—Unverified
Reconfigurable Intelligent Surface-induced Randomness for mmWave Key Generation	Oct 31, 2021	Quantization	—Unverified
Joint SPX-VIX calibration with Gaussian polynomial volatility models: deep pricing with quantization hints	Dec 16, 2022	Quantization	—Unverified
A White Paper on Neural Network Quantization	Jun 15, 2021	Quantization	—Unverified
Joint Texture and Geometry Optimization for RGB-D Reconstruction	Jun 1, 2020	3D ReconstructionQuantization	—Unverified
Joshua 4.0: Packing, PRO, and Paraphrases	Jun 1, 2012	Machine TranslationQuantization	—Unverified
Deployment of Deep Neural Networks for Object Detection on Edge AI Devices with Runtime Optimization	Aug 18, 2021	2D Object Detection3D Object Detection	—Unverified
JPEG-LM: LLMs as Image Generators with Canonical Codec Representations	Aug 15, 2024	Image GenerationQuantization	—Unverified
JPEG Quantized Coefficient Recovery via DCT Domain Spatial-Frequential Transformer	Aug 17, 2023	JPEG Artifact RemovalQuantization	—Unverified
AlphaTuning: Quantization-Aware Parameter-Efficient Adaptation of Large-Scale Pre-Trained Language Models	Oct 8, 2022	Language ModelingLanguage Modelling	—Unverified
Learning low-precision neural networks without Straight-Through Estimator(STE)	Mar 4, 2019	Quantization	—Unverified
Intelligent Fault Diagnosis of Type and Severity in Low-Frequency, Low Bit-Depth Signals	Nov 9, 2024	Fault DiagnosisQuantization	—Unverified
Integrating PHY Security Into NDN-IoT Networks By Exploiting MEC: Authentication Efficiency, Robustness, and Accuracy Enhancement	Oct 29, 2019	Decision MakingEdge-computing	—Unverified
Deep neural networks are robust to weight binarization and other non-linear distortions	Jun 7, 2016	BinarizationData Augmentation	—Unverified
KDLSQ-BERT: A Quantized Bert Combining Knowledge Distillation with Learned Step Size Quantization	Jan 15, 2021	Knowledge DistillationLanguage Modelling	—Unverified
Kernel k-Medoids as General Vector Quantization	Jun 5, 2025	Data CompressionDensity Estimation	—Unverified
Kernel Quantization for Efficient Network Compression	Mar 11, 2020	Quantization	—Unverified
AWEQ: Post-Training Quantization with Activation-Weight Equalization for Large Language Models	Nov 2, 2023	Quantization	—Unverified
Deep neural networks algorithms for stochastic control problems on finite horizon: convergence analysis	Dec 11, 2018	Deep Reinforcement LearningQuantization	—Unverified
Killing Two Birds with One Stone: Quantization Achieves Privacy in Distributed Learning	Apr 26, 2023	Quantization	—Unverified
Learning Kernel-Modulated Neural Representation for Efficient Light Field Compression	Jul 12, 2023	DescriptiveQuantization	—Unverified
K-Means Hashing: An Affinity-Preserving Quantization Method for Learning Binary Compact Codes	Jun 1, 2013	ClusteringQuantization	—Unverified
Knowledge Distillation: A Survey	Jun 9, 2020	Knowledge DistillationModel Compression	—Unverified
Knowledge Distillation in Vision Transformers: A Critical Review	Feb 4, 2023	Decoderimage-classification	—Unverified
Knowledge Transfer in Model-Based Reinforcement Learning Agents for Efficient Multi-Task Learning	Jan 9, 2025	Model-based Reinforcement LearningMulti-Task Learning	—Unverified
Learning Linear Block Codes with Gradient Quantization	Mar 20, 2025	DecoderQuantization	—Unverified
Designing a Classifier for Active Fire Detection from Multispectral Satellite Imagery Using Neural Architecture Search	Oct 7, 2024	Fire DetectionNeural Architecture Search	—Unverified
Kramers-Kronig Receiver Combined With Digital Resolution Enhancer	Jul 22, 2021	Quantization	—Unverified
KurTail : Kurtosis-based LLM Quantization	Mar 3, 2025	GPULanguage Modeling	—Unverified
Integer Scale: A Free Lunch for Faster Fine-grained Quantization of LLMs	May 23, 2024	Quantization	—Unverified
KV Cache is 1 Bit Per Channel: Efficient Large Language Model Inference with Coupled Quantization	May 7, 2024	GPULanguage Modeling	—Unverified
KVmix: Gradient-Based Layer Importance-Aware Mixed-Precision Quantization for KV Cache	May 18, 2025	Quantization	—Unverified
Deep neural networks algorithms for stochastic control problems on finite horizon: numerical applications	Dec 13, 2018	ManagementQuantization	—Unverified
Deep Neural Network Models Compression	Mar 4, 2021	Knowledge DistillationQuantization	—Unverified
L1-Norm Batch Normalization for Efficient Training of Deep Neural Networks	Feb 27, 2018	Computational EfficiencyQuantization	—Unverified
L4Q: Parameter Efficient Quantization-Aware Fine-Tuning on Large Language Models	Feb 7, 2024	Few-Shot LearningIn-Context Learning	—Unverified
Integer or Floating Point? New Outlooks for Low-Bit Quantization on Large Language Models	May 21, 2023	GPUQuantization	—Unverified
A Wave is Worth 100 Words: Investigating Cross-Domain Transferability in Time Series	Dec 1, 2024	ImputationQuantization	—Unverified
LAMBDA: Covering the Solution Set of Black-Box Inequality by Search Space Quantization	Mar 25, 2022	BenchmarkingQuantization	—Unverified
LANCE: Efficient Low-Precision Quantized Winograd Convolution for Neural Networks Based on Graphics Processing Units	Mar 19, 2020	image-classificationImage Classification	—Unverified
Design of Stochastic Quantizers for Privacy Preservation	Mar 5, 2024	Privacy PreservingQuantization	—Unverified
A Low Memory Footprint Quantized Neural Network for Depth Completion of Very Sparse Time-of-Flight Depth Maps	May 25, 2022	DecoderDepth Completion	—Unverified
Learning Sparse Low-Precision Neural Networks With Learnable Regularization	Sep 1, 2018	Image Super-ResolutionL2 Regularization	—Unverified

Show:10 25 50

← PrevPage 48 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified