Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3626–3650 of 4925 papers

Title	Date	Tasks	Status
Nonlinear Sparse Bayesian Learning Methods with Application to Massive MIMO Channel Estimation with Hardware Impairments	Jun 4, 2025	Quantization	—Unverified
Nonlinear Stochastic Gradient Descent and Heavy-tailed Noise: A Unified Framework and High-probability Guarantees	Oct 17, 2024	Quantization	—Unverified
Nonparametric Decentralized Detection and Sparse Sensor Selection via Multi-Sensor Online Kernel Scalar Quantization	May 21, 2022	ClassificationQuantization	—Unverified
Non-Structured DNN Weight Pruning -- Is It Beneficial in Any Platform?	Jul 3, 2019	Model CompressionQuantization	—Unverified
Non-vacuous Generalization Bounds for Deep Neural Networks without any modification to the trained models	Mar 10, 2025	Generalization BoundsQuantization	—Unverified
Non-Volatile Memory Array Based Quantization- and Noise-Resilient LSTM Neural Networks	Feb 25, 2020	Edge-computingGPU	—Unverified
Norm Tweaking: High-performance Low-bit Quantization of Large Language Models	Sep 6, 2023	Model CompressionQuantization	—Unverified
No Token Left Behind: Reliable KV Cache Compression via Importance-Aware Mixed Precision Quantization	Feb 28, 2024	Quantization	—Unverified
Novel Near-Optimal Scalar Quantizers with Exponential Decay Rate and Global Convergence	Feb 18, 2019	Quantization	—Unverified
NQKV: A KV Cache Quantization Scheme Based on Normal Distribution Characteristics	May 22, 2025	Quantization	—Unverified
NSNQuant: A Double Normalization Approach for Calibration-Free Low-Bit Vector Quantization of KV Cache	May 23, 2025	Language ModelingLanguage Modelling	—Unverified
NTP : A Neural Network Topology Profiler	May 22, 2019	BenchmarkingQuantization	—Unverified
NUPES : Non-Uniform Post-Training Quantization via Power Exponent Search	Aug 10, 2023	Quantization	—Unverified
NUQSGD: Provably Communication-efficient Data-parallel SGD via Nonuniform Quantization	Apr 28, 2021	Quantization	—Unverified
NVRC: Neural Video Representation Compression	Sep 11, 2024	Model CompressionQuantization	—Unverified
O(1) Communication for Distributed SGD through Two-Level Gradient Averaging	Jun 12, 2020	QuantizationVocal Bursts Valence Prediction	—Unverified
OAC: Output-adaptive Calibration for Accurate Post-training Quantization	May 23, 2024	Quantization	—Unverified
Oaken: Fast and Efficient LLM Serving with Online-Offline Hybrid KV Cache Quantization	Mar 24, 2025	GPULarge Language Model	—Unverified
oBERTa: Improving Sparse Transfer Learning via improved initialization, distillation, and pruning regimes	Mar 30, 2023	Knowledge DistillationModel Compression	—Unverified
Object Detection-Based Variable Quantization Processing	Sep 1, 2020	MS-SSIMObject	—Unverified
Object Proposal Generation using Two-Stage Cascade SVMs	Jul 20, 2014	Computational EfficiencyObject	—Unverified
ODG-Q: Robust Quantization via Online Domain Generalization	Oct 17, 2022	Domain GeneralizationQuantization	—Unverified
Tighter Regret Analysis and Optimization of Online Federated Learning	May 13, 2022	Federated LearningQuantization	—Unverified
On-Chip Hardware-Aware Quantization for Mixed Precision Neural Networks	Sep 5, 2023	Quantization	—Unverified
Oh! We Freeze: Improving Quantized Knowledge Distillation via Signal Propagation Analysis for Large Language Models	Mar 26, 2024	Knowledge DistillationQuantization	—Unverified

Show:10 25 50

← PrevPage 146 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified