Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1901–1950 of 4925 papers

Title	Date	Tasks	Status
FullPack: Full Vector Utilization for Sub-Byte Quantized Inference on General Purpose CPUs	Nov 13, 2022	CPUQuantization	—Unverified
Full-Precision Free Binary Graph Neural Networks	Sep 29, 2021	Graph Neural NetworkMixture-of-Experts	—Unverified
ADFQ-ViT: Activation-Distribution-Friendly Post-Training Quantization for Vision Transformers	Jul 3, 2024	Attributeimage-classification	—Unverified
Fully Digital Second-order Level-crossing Sampling ADC for Data Saving in Sensing Sparse Signals	Nov 17, 2022	Data CompressionQuantization	—Unverified
FD-LSCIC: Frequency Decomposition-based Learned Screen Content Image Compression	Feb 21, 2025	Image CompressionMS-SSIM	—Unverified
Homomorphic Encryption-Enabled Distance-Based Distributed Formation Control with Distance Mismatch Estimators	Apr 15, 2021	Quantization	—Unverified
FDD Massive MIMO: How to Optimally Combine UL Pilot and Limited DL CSI Feedback?	May 14, 2024	Quantization	—Unverified
FD Cell-Free mMIMO: Analysis and Optimization	Oct 27, 2020	Quantization	—Unverified
Compact Token Representations with Contextual Quantization for Efficient Document Re-ranking	Nov 16, 2021	QuantizationRe-Ranking	—Unverified
Functional Invariants to Watermark Large Transformers	Oct 17, 2023	Quantization	—Unverified
Functional quantization of rough volatility and applications to volatility derivatives	Apr 9, 2021	Quantization	—Unverified
Fundamental Limits of Communication Efficiency for Model Aggregation in Distributed Learning: A Rate-Distortion Approach	Jun 28, 2022	Model CompressionQuantization	—Unverified
Fundamental Trade-offs in Quantized Hybrid Radar Fusion: A CRB-Rate Perspective	Nov 1, 2024	Integrated sensing and communicationISAC	—Unverified
FunQuant: A R package to perform quantization in the context of rare events and time-consuming simulations	Aug 18, 2023	Quantization	—Unverified
FusionSAM: Latent Space driven Segment Anything Model for Multimodal Fusion and Segmentation	Aug 26, 2024	Autonomous DrivingImage Segmentation	—Unverified
Fuzzy-Based Dialectical Non-Supervised Image Classification and Clustering	Dec 3, 2017	ClassificationClustering	—Unverified
Fuzzy Norm-Explicit Product Quantization for Recommender Systems	Dec 8, 2024	QuantizationRecommendation Systems	—Unverified
FxP-QNet: A Post-Training Quantizer for the Design of Mixed Low-Precision DNNs with Dynamic Fixed-Point Representation	Mar 22, 2022	Quantization	—Unverified
FCN-Pose: A Pruned and Quantized CNN for Robot Pose Estimation for Constrained Devices	May 26, 2022	Pose EstimationQuantization	—Unverified
FBQuant: FeedBack Quantization for Large Language Models	Jan 25, 2025	Quantization	—Unverified
Compact Representation for Image Classification: To Choose or to Compress?	Jun 1, 2014	ClassificationCPU	—Unverified
GANCompress: GAN-Enhanced Neural Image Compression with Binary Spherical Quantization	May 19, 2025	Computational EfficiencyImage Compression	—Unverified
FBI: Fingerprinting models with Benign Inputs	Aug 5, 2022	Quantization	—Unverified
Compact recurrent neural networks for acoustic event detection on low-energy low-complexity platforms	Jan 29, 2020	Event DetectionQuantization	—Unverified
GAQAT: gradient-adaptive quantization-aware training for domain generalization	Dec 7, 2024	Domain GeneralizationQuantization	—Unverified
Gaussian Approximation of Quantization Error for Estimation from Compressed Data	Jan 9, 2020	compressed sensingQuantization	—Unverified
Are disentangled representations all you need to build speaker anonymization systems?	Aug 22, 2022	AllAutomatic Speech Recognition	—Unverified
A Deep Learning Inference Scheme Based on Pipelined Matrix Multiplication Acceleration Design and Non-uniform Quantization	Oct 10, 2021	Edge-computingQ-Learning	—Unverified
Accelerator-Aware Training for Transducer-Based Speech Recognition	May 12, 2023	CPUQuantization	—Unverified
Gaussian Rate-Distortion-Perception Coding and Entropy-Constrained Scalar Quantization	Sep 4, 2024	Quantization	—Unverified
Fault-Tolerant Four-Dimensional Constellation for Coherent Optical Transmission Systems	Nov 29, 2023	Quantization	—Unverified
GDRQ: Group-based Distribution Reshaping for Quantization	Aug 5, 2019	Quantization	—Unverified
Compact Neural Graphics Primitives with Learned Hash Probing	Dec 28, 2023	Quantization	—Unverified
FATNN: Fast and Accurate Ternary Neural Networks	Aug 12, 2020	image-classificationImage Classification	—Unverified
CompactifAI: Extreme Compression of Large Language Models using Quantum-Inspired Tensor Networks	Jan 25, 2024	Model CompressionQuantization	—Unverified
Gender Bias Amplification During Speed-Quality Optimization in Neural Machine Translation	Jun 1, 2021	DecoderMachine Translation	—Unverified
Are Conventional SNNs Really Efficient? A Perspective from Network Quantization	Jan 1, 2024	FairnessQuantization	—Unverified
FAT: An In-Memory Accelerator with Fast Addition for Ternary Weight Neural Networks	Jan 19, 2022	Quantization	—Unverified
Fast top-K Cosine Similarity Search through XOR-Friendly Binary Quantization on GPUs	Aug 5, 2020	GPUQuantization	—Unverified
Compact and Robust Deep Learning Architecture for Fluorescence Lifetime Imaging and FPGA Implementation	Sep 7, 2022	Quantization	—Unverified
Line Spectrum Estimation and Detection with Few-bit ADCs: Theoretical Analysis and Generalized NOMP Algorithm	Jul 2, 2023	QuantizationSuper-Resolution	—Unverified
Fast Template Evaluation with Vector Quantization	Dec 1, 2013	object-detectionObject Detection	—Unverified
A Reconstruction-Computation-Quantization (RCQ) Approach to Node Operations in LDPC Decoding	May 14, 2020	DecoderQuantization	—Unverified
A Deep Hashing Learning Network	Jul 16, 2015	Deep HashingQuantization	—Unverified
FastSGD: A Fast Compressed SGD Framework for Distributed Machine Learning	Dec 8, 2021	BIG-bench Machine LearningQuantization	—Unverified
FastQuery: Communication-efficient Embedding Table Query for Private LLM Inference	May 25, 2024	Quantization	—Unverified
A reconfigurable neural network ASIC for detector front-end data compression at the HL-LHC	May 4, 2021	Data CompressionHigh-Level Synthesis	—Unverified
Generating 3D Brain Tumor Regions in MRI using Vector-Quantization Generative Adversarial Networks	Oct 2, 2023	Brain Tumor ClassificationBrain Tumor Segmentation	—Unverified
Generating diverse and natural text-to-speech samples using a quantized fine-grained VAE and auto-regressive prosody prior	Feb 6, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Fast Orthogonal Projection Based on Kronecker Product	Dec 1, 2015	Image RetrievalQuantization	—Unverified

Show:10 25 50

← PrevPage 39 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified