Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1951–2000 of 4925 papers

Title	Date	Tasks	Status
FAT: An In-Memory Accelerator with Fast Addition for Ternary Weight Neural Networks	Jan 19, 2022	Quantization	—Unverified
Fast top-K Cosine Similarity Search through XOR-Friendly Binary Quantization on GPUs	Aug 5, 2020	GPUQuantization	—Unverified
Compact and Robust Deep Learning Architecture for Fluorescence Lifetime Imaging and FPGA Implementation	Sep 7, 2022	Quantization	—Unverified
Generative Design of Hardware-aware DNNs	Jun 6, 2020	Quantization	—Unverified
Generative Diffusion Models for Lattice Field Theory	Nov 6, 2023	Quantization	—Unverified
Fast Template Evaluation with Vector Quantization	Dec 1, 2013	object-detectionObject Detection	—Unverified
Generative QoE Modeling: A Lightweight Approach for Telecom Networks	Apr 30, 2025	Computational EfficiencyQuantization	—Unverified
Generative Semantic Communication for Text-to-Speech Synthesis	Oct 4, 2024	QuantizationSemantic Communication	—Unverified
A Reconstruction-Computation-Quantization (RCQ) Approach to Node Operations in LDPC Decoding	May 14, 2020	DecoderQuantization	—Unverified
A Deep Hashing Learning Network	Jul 16, 2015	Deep HashingQuantization	—Unverified
FastSGD: A Fast Compressed SGD Framework for Distributed Machine Learning	Dec 8, 2021	BIG-bench Machine LearningQuantization	—Unverified
FastQuery: Communication-efficient Embedding Table Query for Private LLM Inference	May 25, 2024	Quantization	—Unverified
A reconfigurable neural network ASIC for detector front-end data compression at the HL-LHC	May 4, 2021	Data CompressionHigh-Level Synthesis	—Unverified
Geometry and clustering with metrics derived from separable Bregman divergences	Oct 25, 2018	ClusteringQuantization	—Unverified
Fast Orthogonal Projection Based on Kronecker Product	Dec 1, 2015	Image RetrievalQuantization	—Unverified
Getting Free Bits Back from Rotational Symmetries in LLMs	Oct 2, 2024	Quantization	—Unverified
Fast on-line signature recognition based on VQ with time modeling	Mar 23, 2022	Quantization	—Unverified
GHN-Q: Parameter Prediction for Unseen Quantized Convolutional Architectures via Graph Hypernetworks	Aug 26, 2022	Adversarial RobustnessParameter Prediction	—Unverified
A Reconfigurable Dual-Mode Tracking SAR ADC without Analog Subtraction	May 28, 2019	Quantization	—Unverified
Acceleration of Convolutional Neural Network Using FFT-Based Split Convolutions	Mar 27, 2020	Quantization	—Unverified
3D Pathfinding and Collision Avoidance Using Uneven Search-space Quantization and Visual Cone Search	Jun 5, 2017	Collision AvoidanceQuantization	—Unverified
Givens Coordinate Descent Methods for Rotation Matrix Learning in Trainable Embedding Indexes	Mar 9, 2022	Quantization	—Unverified
Synaptic Modulation using Interspike Intervals Increases Energy Efficiency of Spiking Neural Networks	Aug 6, 2024	Quantization	—Unverified
FastMamba: A High-Speed and Efficient Mamba Accelerator on FPGA with Accurate Quantization	May 25, 2025	Computational EfficiencyCPU	—Unverified
Communication-efficient Variance-reduced Stochastic Gradient Descent	Mar 10, 2020	Distributed OptimizationQuantization	—Unverified
Global synchronization of multi-agent systems with nonlinear interactions	Mar 13, 2025	Quantization	—Unverified
Goal-oriented compression for L_p-norm-type goal functions: Application to power consumption scheduling	May 13, 2024	Data CompressionQuantization	—Unverified
Goal-Oriented Quantization: Analysis, Design, and Application to Resource Allocation	Sep 30, 2022	Quantization	—Unverified
Fast Low-rank Representation based Spatial Pyramid Matching for Image Classification	Sep 22, 2014	General Classificationimage-classification	—Unverified
GOBO: Quantizing Attention-Based NLP Models for Low Latency and Energy Efficient Inference	May 8, 2020	Natural Language UnderstandingQuantization	—Unverified
Communication-Efficient Split Learning via Adaptive Feature-Wise Compression	Jul 20, 2023	Quantization	—Unverified
Going Further With Winograd Convolutions: Tap-Wise Quantization for Efficient Inference on 4x4 Tile	Sep 26, 2022	Quantization	—Unverified
Google USM: Scaling Automatic Speech Recognition Beyond 100 Languages	Mar 2, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Fast learning rates with heavy-tailed losses	Sep 29, 2016	ClusteringQuantization	—Unverified
gpcgc: a green point cloud geometry coding method	Feb 13, 2023	Quantization	—Unverified
GPLQ: A General, Practical, and Lightning QAT Method for Vision Transformers	Jun 13, 2025	Fine-Grained Image ClassificationQuantization	—Unverified
Fast Large-Scale Discrete Optimization Based on Principal Coordinate Descent	Sep 16, 2019	Quantization	—Unverified
GPTQT: Quantize Large Language Models Twice to Push the Efficiency	Jul 3, 2024	Quantization	—Unverified
Fast Jet Tagging with MLP-Mixers on FPGAs	Mar 5, 2025	Jet TaggingQuantization	—Unverified
Fast Inference of Tree Ensembles on ARM Devices	May 15, 2023	Quantization	—Unverified
Communication Efficient SGD via Gradient Sampling With Bayes Prior	Jun 19, 2021	image-classificationImage Classification	—Unverified
GQ-Net: Training Quantization-Friendly Deep Networks	Sep 25, 2019	Model CompressionQuantization	—Unverified
GQSA: Group Quantization and Sparsity for Accelerating Large Language Model Inference	Dec 23, 2024	GPULanguage Modeling	—Unverified
GradFreeBits: Gradient Free Bit Allocation for Dynamic Low Precision Neural Networks	Feb 18, 2021	Quantization	—Unverified
AddNet: Deep Neural Networks Using FPGA-Optimized Multipliers	Nov 19, 2019	Quantization	—Unverified
WaveQ: Gradient-Based Deep Quantization of Neural Networks through Sinusoidal Adaptive Regularization	Feb 29, 2020	Quantization	—Unverified
Gradient Based Method for the Fusion of Lattice Quantizers	Feb 9, 2025	Quantization	—Unverified
Gradient-Based Post-Training Quantization: Challenging the Status Quo	Aug 15, 2023	Quantization	—Unverified
Gradient Descent Quantizes ReLU Network Features	Mar 22, 2018	Quantization	—Unverified
Fast Implementation of 4-bit Convolutional Neural Networks for Mobile Devices	Sep 14, 2020	Optical Character Recognition (OCR)Quantization	—Unverified

Show:10 25 50

← PrevPage 40 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified