Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2001–2050 of 4925 papers

Title	Date	Tasks	Status
Gradient _1 Regularization for Quantization Robustness	Feb 18, 2020	Quantization	—Unverified
Gradient-Free Neural Network Training on the Edge	Oct 13, 2024	Quantization	—Unverified
Does Video Compression Impact Tracking Accuracy?	Feb 2, 2022	Multiple Object TrackingObject	—Unverified
GradiVeQ: Vector Quantization for Bandwidth-Efficient Gradient Aggregation in Distributed CNN Training	Nov 8, 2018	Dimensionality ReductionQuantization	—Unverified
BiQGEMM: Matrix Multiplication with Lookup Table For Binary-Coding-based Quantized DNNs	May 20, 2020	Quantization	—Unverified
Granger Causality from Quantized Measurements	Jun 3, 2021	Gaussian ProcessesQuantization	—Unverified
Countering Adversarial Examples: Combining Input Transformation and Noisy Training	Jun 25, 2021	Data AugmentationQuantization	—Unverified
GranQ: Granular Zero-Shot Quantization with Channel-Wise Activation Scaling in QAT	Mar 24, 2025	Neural Network CompressionQuantization	—Unverified
Graph-Based Depth Denoising & Dequantization for Point Cloud Enhancement	Nov 9, 2021	DenoisingGraph Learning	—Unverified
Graph-Collaborated Auto-Encoder Hashing for Multi-view Binary Clustering	Jan 6, 2023	ClusteringQuantization	—Unverified
An Empirical Study of Low Precision Quantization for TinyML	Mar 10, 2022	BIG-bench Machine LearningModel Compression	—Unverified
Does compressing activations help model parallel training?	Jan 6, 2023	modelQuantization	—Unverified
Greedy Selection for Heterogeneous Sensors	Jul 3, 2023	Quantization	—Unverified
Greener yet Powerful: Taming Large Code Generation Models with Quantization	Mar 9, 2023	Code GenerationCode Summarization	—Unverified
An Embedded Iris Recognition System Optimization using Dynamically ReconfigurableDecoder with LDPC Codes	Jul 8, 2021	DecoderIris Recognition	—Unverified
Do All MobileNets Quantize Poorly? Gaining Insights into the Effect of Quantization on Depthwise Separable Convolutional Networks Through the Eyes of Multi-scale Distributional Dynamics	Apr 24, 2021	AllQuantization	—Unverified
DNQ: Dynamic Network Quantization	Dec 6, 2018	Quantization	—Unverified
DNN Quantization with Attention	Mar 24, 2021	Object RecognitionQuantization	—Unverified
Gridless Multisnapshot Variational Line Spectral Estimation from Coarsely Quantized Samples	Jun 20, 2019	Quantization	—Unverified
Group channel pruning and spatial attention distilling for object detection	Jun 2, 2023	Knowledge DistillationModel Compression	—Unverified
Grouped Sequency-arranged Rotation: Optimizing Rotation Transformation for Quantization for Free	May 2, 2025	Quantization	—Unverified
Group Invariant Deep Representations for Image Instance Retrieval	Jan 9, 2016	Dimensionality Reductionimage-classification	—Unverified
SwiftPrune: Hessian-Free Weight Pruning for Large Language Models	Jan 24, 2025	Model CompressionQuantization	—Unverified
Hybrid and Non-Uniform DNN quantization methods using Retro Synthesis data for efficient inference	Jan 1, 2021	Quantization	—Unverified
Group Sparse Coding	Dec 1, 2009	Computational EfficiencyGeneral Classification	—Unverified
CQ-VAE: Coordinate Quantized VAE for Uncertainty Estimation with Application to Disk Shape Analysis from Lumbar Spine MRI Images	Oct 17, 2020	Quantization	—Unverified
DNN Memory Footprint Reduction via Post-Training Intra-Layer Multi-Precision Quantization	Apr 3, 2024	Edge-computingQuantization	—Unverified
GSVR: 2D Gaussian-based Video Representation for 800+ FPS with Hybrid Deformation Field	Jul 8, 2025	QuantizationVideo Compression	—Unverified
Guaranteed Quantization Error Computation for Neural Network Model Compression	Apr 26, 2023	Model CompressionNeural Network Compression	—Unverified
CRB Analysis for Mixed-ADC Based DOA Estimation	Mar 14, 2024	QuantizationSparse Learning	—Unverified
Biologically Plausible Learning on Neuromorphic Hardware Architectures	Dec 29, 2022	BenchmarkingQuantization	—Unverified
Bioinspired Cortex-based Fast Codebook Generation	Jan 28, 2022	Anomaly DetectionBIG-bench Machine Learning	—Unverified
Gull: A Generative Multifunctional Audio Codec	Apr 7, 2024	Audio CompressionAudio Source Separation	—Unverified
GWQ: Gradient-Aware Weight Quantization for Large Language Models	Oct 30, 2024	Outlier DetectionQuantization	—Unverified
Haar Wavelet Feature Compression for Quantized Graph Convolutional Networks	Oct 10, 2021	Feature CompressionNode Classification	—Unverified
DNA-TEQ: An Adaptive Exponential Quantization of Tensors for DNN Inference	Jun 28, 2023	Quantization	—Unverified
HACK: Homomorphic Acceleration via Compression of the Key-Value Cache for Disaggregated LLM Inference	Feb 5, 2025	Language ModelingLanguage Modelling	—Unverified
An Efficient Network with Novel Quantization Designed for Massive MIMO CSI Feedback	May 30, 2024	Quantization	—Unverified
Hadamard Domain Training with Integers for Class Incremental Quantized Learning	Oct 5, 2023	Activity Recognitionclass-incremental learning	—Unverified
HadaNets: Flexible Quantization Strategies for Neural Networks	May 26, 2019	Model CompressionQuantization	—Unverified
HadaNorm: Diffusion Transformer Quantization through Mean-Centered Transformations	Jun 11, 2025	Image GenerationQuantization	—Unverified
HALL-E: Hierarchical Neural Codec Language Model for Minute-Long Zero-Shot Text-to-Speech Synthesis	Oct 6, 2024	Language ModelingLanguage Modelling	—Unverified
Human Activity Recognition on Microcontrollers with Quantized and Adaptive Deep Neural Networks	Sep 2, 2022	Activity RecognitionHuman Activity Recognition	—Unverified
Divide and Conquer: Leveraging Intermediate Feature Representations for Quantized Training of Neural Networks	Jun 14, 2019	Knowledge DistillationQuantization	—Unverified
HALO: Hardware-aware quantization with low critical-path-delay weights for LLM acceleration	Feb 27, 2025	Quantization	—Unverified
LANA: Latency Aware Network Acceleration	Jul 12, 2021	CPUGPU	—Unverified
BinaryViT: Towards Efficient and Accurate Binary Vision Transformers	May 24, 2023	BinarizationQuantization	—Unverified
An Efficient Index for Visual Search in Appearance-based SLAM	Sep 27, 2013	ClusteringQuantization	—Unverified
Diversifying Sample Generation for Accurate Data-Free Quantization	Mar 1, 2021	Data Free Quantizationimage-classification	—Unverified
QVGen: Pushing the Limit of Quantized Video Generative Models	May 16, 2025	Quantization	—Unverified

Show:10 25 50

← PrevPage 41 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified