Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3301–3350 of 4925 papers

Title	Date	Tasks	Status
What Does a One-Bit Quanta Image Sensor Offer?	Aug 19, 2022	Quantization	—Unverified
What Happens When Small Is Made Smaller? Exploring the Impact of Compression on Small Data Pretrained Language Models	Apr 6, 2024	Knowledge DistillationLanguage Modeling	—Unverified
An Evaluation of Memory Optimization Methods for Training Neural Networks	Mar 26, 2023	Quantization	—Unverified
What Makes Quantization for Large Language Models Hard? An Empirical Study from the Lens of Perturbation	Mar 11, 2024	Computational EfficiencyQuantization	—Unverified
When are 1.58 bits enough? A Bottom-up Exploration of BitNet Quantization	Nov 8, 2024	DecoderQuantization	—Unverified
When Bio-Inspired Computing meets Deep Learning: Low-Latency, Accurate, & Energy-Efficient Spiking Neural Networks from Artificial Neural Networks	Dec 12, 2023	Quantization	—Unverified
When Compression Meets Model Compression: Memory-Efficient Double Compression for Large Language Models	Feb 21, 2025	Model CompressionQuantization	—Unverified
When Reasoning Meets Compression: Benchmarking Compressed Large Reasoning Models on Complex Reasoning Tasks	Apr 2, 2025	BenchmarkingLanguage Modeling	—Unverified
Where Should We Begin? A Low-Level Exploration of Weight Initialization Impact on Quantized Behaviour of Deep Neural Networks	Nov 30, 2020	Quantization	—Unverified
Which Space Partitioning Tree to Use for Search?	Dec 1, 2013	Quantization	—Unverified
DQ-Whisper: Joint Distillation and Quantization for Efficient Multilingual Speech Recognition	May 18, 2023	Knowledge DistillationQuantization	—Unverified
Why Quantization Improves Generalization: NTK of Binary Weight Neural Networks	Jun 13, 2022	Quantization	—Unverified
Wide Flat Minimum Watermarking for Robust Ownership Verification of GANs	Oct 25, 2023	Quantization	—Unverified
Widening and Squeezing: Towards Accurate and Efficient QNNs	Feb 3, 2020	Quantization	—Unverified
Winning Amazon KDD Cup'24	Aug 5, 2024	Data AugmentationMultiple-choice	—Unverified
Wireless End-to-End Image Transmission System using Semantic Communications	Feb 27, 2023	DecoderQuantization	—Unverified
Wireless Quantized Federated Learning: A Joint Computation and Communication Design	Mar 11, 2022	Federated LearningQuantization	—Unverified
Within-basket Recommendation via Neural Pattern Associator	Jan 25, 2024	Quantization	—Unverified
Within the Dynamic Context: Inertia-aware 3D Human Modeling with Pose Sequence	Mar 28, 2024	Neural RenderingQuantization	—Unverified
Witten-type topological field theory of self-organized criticality for stochastic neural networks	Jun 21, 2021	Quantization	—Unverified
WKVQuant: Quantizing Weight and Key/Value Cache for Large Language Models Gains More	Feb 19, 2024	QuantizationText Generation	—Unverified
Word-based Domain Adaptation for Neural Machine Translation	Jun 7, 2019	Domain AdaptationLanguage Modeling	—Unverified
Work in Progress: Linear Transformers for TinyML	Mar 25, 2024	Keyword SpottingKeyword Spotting on Google Speech Commands	—Unverified
WrapNet: Neural Net Inference with Ultra-Low-Resolution Arithmetic	Jul 26, 2020	Quantization	—Unverified
WrapNet: Neural Net Inference with Ultra-Low-Precision Arithmetic	Jan 1, 2021	Quantization	—Unverified
WRPN: Training and Inference using Wide Reduced-Precision Networks	Apr 10, 2017	Quantization	—Unverified
WSMN: An optimized multipurpose blind watermarking in Shearlet domain using MLP and NSGA-II	May 7, 2020	QuantizationSSIM	—Unverified
WSNet: Compact and Efficient Networks Through Weight Sampling	Nov 28, 2017	Audio ClassificationGeneral Classification	—Unverified
WSNet: Learning Compact and Efficient Networks with Weight Sampling	Jan 1, 2018	Audio ClassificationGeneral Classification	—Unverified
Wyner-Ziv Gradient Compression for Federated Learning	Nov 16, 2021	Federated LearningQuantization	—Unverified
XCAT -- Lightweight Quantized Single Image Super-Resolution using Heterogeneous Group Convolutions and Cross Concatenation	Aug 31, 2022	Data AugmentationGPU	—Unverified
XNORBIN: A 95 TOp/s/W Hardware Accelerator for Binary Convolutional Neural Networks	Mar 5, 2018	Quantization	—Unverified
XNOR-Net++: Improved Binary Neural Networks	Sep 30, 2019	BinarizationClassification with Binary Neural Network	—Unverified
YONO: Modeling Multiple Heterogeneous Neural Networks on Microcontrollers	Mar 8, 2022	Multi-Task LearningQuantization	—Unverified
You Never Know: Quantization Induces Inconsistent Biases in Vision-Language Foundation Models	Oct 26, 2024	Quantization	—Unverified
YUVMultiNet: Real-time YUV multi-task CNN for autonomous driving	Apr 11, 2019	Autonomous DrivingQuantization	—Unverified
Consistent Signal Reconstruction from Streaming Multivariate Time Series	Aug 23, 2023	QuantizationTime Series	—Unverified
Zero-Delay Gaussian Joint Source-Channel Coding for the Interference Channel	Jan 24, 2018	Quantization	—Unverified
FDC: Fast KV Dimensionality Compression for Efficient LLM Inference	Aug 7, 2024	Quantization	—Unverified
ZeRO++: Extremely Efficient Collective Communication for Giant Model Training	Jun 16, 2023	GPUQuantization	—Unverified
ZeroQuant-FP: A Leap Forward in LLMs Post-Training W4A8 Quantization Using Floating-Point Formats	Jul 19, 2023	Computational EfficiencyQuantization	—Unverified
ZeroQuant-HERO: Hardware-Enhanced Robust Optimized Post-Training Quantization Framework for W8A8 Transformers	Oct 26, 2023	Quantization	—Unverified
Zero-shot Adversarial Quantization	Mar 29, 2021	Data Free QuantizationQuantization	—Unverified
Zero-Shot Learning of a Conditional Generative Adversarial Network for Data-Free Network Quantization	Oct 26, 2022	Data Free QuantizationGenerative Adversarial Network	—Unverified
Zero-shot Quantization: A Comprehensive Survey	May 14, 2025	QuantizationSurvey	—Unverified
Zero-Shot Sharpness-Aware Quantization for Pre-trained Language Models	Oct 20, 2023	Language ModelingLanguage Modelling	—Unverified
Zeroth-Order Fine-Tuning of LLMs with Extreme Sparsity	Jun 5, 2024	GPUQuantization	—Unverified
ZipML: Training Linear Models with End-to-End Low Precision, and a Little Bit of Deep Learning	Aug 1, 2017	Quantization	—Unverified
ZipVL: Efficient Large Vision-Language Models with Dynamic Token Sparsification	Oct 11, 2024	MMEQuantization	—Unverified
ZOBNN: Zero-Overhead Dependable Design of Binary Neural Networks with Deliberately Quantized Parameters	Jul 6, 2024	AttributeQuantization	—Unverified

Show:10 25 50

← PrevPage 67 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified