Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1901–1950 of 4925 papers

Title	Date	Tasks	Status
FullPack: Full Vector Utilization for Sub-Byte Quantized Inference on General Purpose CPUs	Nov 13, 2022	CPUQuantization	—Unverified
Full-Precision Free Binary Graph Neural Networks	Sep 29, 2021	Graph Neural NetworkMixture-of-Experts	—Unverified
Auditing Black-Box LLM APIs with a Rank-Based Uniformity Test	Jun 8, 2025	Quantization	—Unverified
Fully Digital Second-order Level-crossing Sampling ADC for Data Saving in Sensing Sparse Signals	Nov 17, 2022	Data CompressionQuantization	—Unverified
Fully Distributed and Quantized Algorithm for MPC-based Autonomous Vehicle Platooning Optimization	Jan 31, 2025	Model Predictive ControlQuantization	—Unverified
Homomorphic Encryption-Enabled Distance-Based Distributed Formation Control with Distance Mismatch Estimators	Apr 15, 2021	Quantization	—Unverified
On the Convergence of Differentially Private Federated Learning on Non-Lipschitz Objectives, and with Normalized Client Updates	Jun 13, 2021	BenchmarkingFederated Learning	—Unverified
Fully Quantized Network for Object Detection	Jun 1, 2019	Efficient Neural NetworkObject	—Unverified
DP-Net: Dynamic Programming Guided Deep Neural Network Compression	Mar 21, 2020	ClusteringNeural Network Compression	—Unverified
Functional Invariants to Watermark Large Transformers	Oct 17, 2023	Quantization	—Unverified
Functional quantization of rough volatility and applications to volatility derivatives	Apr 9, 2021	Quantization	—Unverified
Fundamental Limits of Communication Efficiency for Model Aggregation in Distributed Learning: A Rate-Distortion Approach	Jun 28, 2022	Model CompressionQuantization	—Unverified
Fundamental Trade-offs in Quantized Hybrid Radar Fusion: A CRB-Rate Perspective	Nov 1, 2024	Integrated sensing and communicationISAC	—Unverified
FunQuant: A R package to perform quantization in the context of rare events and time-consuming simulations	Aug 18, 2023	Quantization	—Unverified
FusionSAM: Latent Space driven Segment Anything Model for Multimodal Fusion and Segmentation	Aug 26, 2024	Autonomous DrivingImage Segmentation	—Unverified
Fuzzy-Based Dialectical Non-Supervised Image Classification and Clustering	Dec 3, 2017	ClassificationClustering	—Unverified
Fuzzy Norm-Explicit Product Quantization for Recommender Systems	Dec 8, 2024	QuantizationRecommendation Systems	—Unverified
FxP-QNet: A Post-Training Quantizer for the Design of Mixed Low-Precision DNNs with Dynamic Fixed-Point Representation	Mar 22, 2022	Quantization	—Unverified
A "Network Pruning Network" Approach to Deep Model Compression	Jan 15, 2020	Knowledge DistillationModel Compression	—Unverified
GALA: Geometry-Aware Local Adaptive Grids for Detailed 3D Generation	Oct 13, 2024	3D GenerationQuantization	—Unverified
Downlink MIMO Channel Estimation from Bits: Recoverability and Algorithm	Nov 25, 2024	Quantization	—Unverified
GANCompress: GAN-Enhanced Neural Image Compression with Binary Spherical Quantization	May 19, 2025	Computational EfficiencyImage Compression	—Unverified
Bit-Mixer: Mixed-precision networks with runtime bit-width selection	Mar 31, 2021	AutoMLBinarization	—Unverified
An End-to-End DNN Inference Framework for the SpiNNaker2 Neuromorphic MPSoC	Jul 18, 2025	QuantizationScheduling	—Unverified
GAQAT: gradient-adaptive quantization-aware training for domain generalization	Dec 7, 2024	Domain GeneralizationQuantization	—Unverified
Gaussian Approximation of Quantization Error for Estimation from Compressed Data	Jan 9, 2020	compressed sensingQuantization	—Unverified
Gaussian AutoEncoder	Nov 12, 2018	Data CompressionQuantization	—Unverified
Downlink Clustering-Based Scheduling of IRS-Assisted Communications With Reconfiguration Constraints	May 23, 2023	ClusteringQuantization	—Unverified
Gaussian Mixture Vector Quantization with Aggregated Categorical Posterior	Oct 14, 2024	Quantization	—Unverified
Gaussian Rate-Distortion-Perception Coding and Entropy-Constrained Scalar Quantization	Sep 4, 2024	Quantization	—Unverified
Double Viterbi: Weight Encoding for High Compression Ratio and Fast On-Chip Reconstruction for Deep Neural Network	May 1, 2019	Model CompressionQuantization	—Unverified
GDRQ: Group-based Distribution Reshaping for Quantization	Aug 5, 2019	Quantization	—Unverified
Double Quantization for Communication-Efficient Distributed Optimization	May 25, 2018	Distributed OptimizationQuantization	—Unverified
Double JPEG Detection in Mixed JPEG Quality Factors using Deep Convolutional Neural Network	Sep 1, 2018	Quantization	—Unverified
Bit Efficient Quantization for Deep Neural Networks	Oct 7, 2019	ClusteringQuantization	—Unverified
Gender Bias Amplification During Speed-Quality Optimization in Neural Machine Translation	Jun 1, 2021	DecoderMachine Translation	—Unverified
A blob method for inhomogeneous diffusion with applications to multi-agent control and sampling	Feb 25, 2022	Quantization	—Unverified
Hardware-Friendly Static Quantization Method for Video Diffusion Transformers	Feb 20, 2025	QuantizationVideo Generation	—Unverified
HarmLevelBench: Evaluating Harm-Level Compliance and the Impact of Quantization on Model Alignment	Nov 11, 2024	Quantization	—Unverified
Minimax Excess Risk of First-Order Methods for Statistical Learning with Data-Dependent Oracles	Jul 10, 2023	Federated Learningparameter estimation	—Unverified
Line Spectrum Estimation and Detection with Few-bit ADCs: Theoretical Analysis and Generalized NOMP Algorithm	Jul 2, 2023	QuantizationSuper-Resolution	—Unverified
DoTA: Weight-Decomposed Tensor Adaptation for Large Language Models	Dec 30, 2024	Arithmetic ReasoningQuantization	—Unverified
Continuous Speech Synthesis using per-token Latent Diffusion	Oct 21, 2024	Image GenerationQuantization	—Unverified
Generalized residual vector quantization for large scale data	Sep 17, 2016	Information RetrievalQuantization	—Unverified
A Survey on Learning to Hash	Jun 1, 2016	QuantizationSurvey	—Unverified
General Point Model with Autoencoding and Autoregressive	Oct 25, 2023	DecoderLanguage Modeling	—Unverified
A Biresolution Spectral Framework for Product Quantization	Jun 1, 2018	Quantization	—Unverified
Generating 3D Brain Tumor Regions in MRI using Vector-Quantization Generative Adversarial Networks	Oct 2, 2023	Brain Tumor ClassificationBrain Tumor Segmentation	—Unverified
Generating diverse and natural text-to-speech samples using a quantized fine-grained VAE and auto-regressive prosody prior	Feb 6, 2020	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Don't Waste Your Bits! Squeeze Activations and Gradients for Deep Neural Networks via TinyScript	Jan 1, 2020	Quantization	—Unverified

Show:10 25 50

← PrevPage 39 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified