Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4801–4850 of 4925 papers

Title	Date	Tasks	Status
High-Dimensional Distribution Generation Through Deep Neural Networks	Jul 26, 2021	QuantizationVocal Bursts Intensity Prediction	—Unverified
High Dimensional Statistical Estimation under Uniformly Dithered One-bit Quantization	Feb 26, 2022	compressed sensingLow-Rank Matrix Completion	—Unverified
High-Dimensional Stochastic Gradient Quantization for Communication-Efficient Edge Learning	Oct 9, 2019	Federated LearningQuantization	—Unverified
High-Fidelity Facial Albedo Estimation via Texture Quantization	Jun 19, 2024	3D Face ReconstructionFace Reconstruction	—Unverified
High Five: Improving Gesture Recognition by Embracing Uncertainty	Oct 25, 2017	ClassificationGeneral Classification	—Unverified
Highly Efficient and Effective LLMs with Multi-Boolean Architectures	May 28, 2025	BinarizationQuantization	—Unverified
Highly Efficient SNNs for High-speed Object Detection	Sep 27, 2023	GPUObject	—Unverified
High-Order Signed Distance Transform of Sampled Signals	Oct 26, 2021	QuantizationUnity	—Unverified
High-Perceptual Quality JPEG Decoding via Posterior Sampling	Nov 21, 2022	JPEG Artifact CorrectionQuantization	—Unverified
High Performance Natural Language Processing	Nov 1, 2020	Knowledge DistillationQuantization	—Unverified
High-probability Convergence Bounds for Nonlinear Stochastic Gradient Descent Under Heavy-tailed Noise	Oct 28, 2023	Quantization	—Unverified
High-quality Single-model Deep Video Compression with Frame-Conv3D and Multi-frame Differential Modulation	Aug 1, 2020	QuantizationVideo Compression	—Unverified
High-Resolution Volumetric Reconstruction for Clothed Humans	Jul 25, 2023	Quantization	—Unverified
High-Resolution WiFi Imaging with Reconfigurable Intelligent Surfaces	Dec 1, 2021	Privacy PreservingQuantization	—Unverified
High-Throughput Blind Co-Channel Interference Cancellation for Edge Devices Using Depthwise Separable Convolutions, Quantization, and Pruning	Nov 19, 2024	blind source separationComputational Efficiency	—Unverified
HiKonv: High Throughput Quantized Convolution With Novel Bit-wise Management and Computation	Dec 28, 2021	CPUManagement	—Unverified
HiKonv: Maximizing the Throughput of Quantized Convolution With Novel Bit-wise Management and Computation	Jul 22, 2022	CPUManagement	—Unverified
Histogram-Equalized Quantization for logic-gated Residual Neural Networks	Jan 8, 2025	Quantization	—Unverified
HitNet: Hybrid Ternary Recurrent Neural Network	Dec 1, 2018	Quantization	—Unverified
HLQ: Fast and Efficient Backpropagation via Hadamard Low-rank Quantization	Jun 21, 2024	Quantization	—Unverified
HM-ANN: Efficient Billion-Point Nearest Neighbor Search on Heterogeneous Memory	Dec 1, 2020	Data CompressionQuantization	—Unverified
HoloFormer: Deep Compression of Pre-Trained Transforms via Unified Optimization of N:M Sparsity and Integer Quantization	Sep 29, 2021	Quantization	—Unverified
On the Impact of Calibration Data in Post-training Quantization and Pruning	Nov 16, 2023	Model CompressionQuantization	—Unverified
How Does Quantization Affect Multilingual LLMs?	Jul 3, 2024	Mathematical ReasoningQuantization	—Unverified
How LSTM Encodes Syntax: Exploring Context Vectors and Semi-Quantization on Natural Text	Oct 1, 2020	Language ModelingLanguage Modelling	—Unverified
How Should We Extract Discrete Audio Tokens from Self-Supervised Models?	Jun 15, 2024	QuantizationSelf-Supervised Learning	—Unverified
How to Attain Communication-Efficient DNN Training? Convert, Compress, Correct	Apr 18, 2022	Quantization	—Unverified
How to design a derivatives market?	Sep 19, 2019	Quantization	—Unverified
How to Parameterize Asymmetric Quantization Ranges for Quantization-Aware Training	Apr 25, 2024	Quantization	—Unverified
HPGN: Hybrid Priors-Guided Network for Compressed Low-Light Image Enhancement	Apr 3, 2025	Image EnhancementLow-Light Image Enhancement	—Unverified
HQ-DiT: Efficient Diffusion Transformer with FP4 Hybrid Quantization	May 30, 2024	Quantization	—Unverified
HQNAS: Auto CNN deployment framework for joint quantization and architecture search	Oct 16, 2022	GPUNeural Architecture Search	—Unverified
HQ-VAE: Hierarchical Discrete Representation Learning with Variational Bayes	Dec 31, 2023	QuantizationRepresentation Learning	—Unverified
HRPVT: High-Resolution Pyramid Vision Transformer for medium and small-scale human pose estimation	Oct 29, 2024	Pose EstimationQuantization	—Unverified
Huber-energy measure quantization	Dec 15, 2022	QuantizationStochastic Optimization	—Unverified
Huff-LLM: End-to-End Lossless Compression for Efficient LLM Inference	Feb 2, 2025	Model CompressionQuantization	—Unverified
Human Activity Recognition on Microcontrollers with Quantized and Adaptive Deep Neural Networks	Sep 2, 2022	Activity RecognitionHuman Activity Recognition	—Unverified
Human-level molecular optimization driven by mol-gene evolution	Jun 13, 2024	Drug DiscoveryQuantization	—Unverified
Human Symmetry Uncertainty Detected by a Self-Organizing Neural Network Map	Feb 27, 2021	Quantization	—Unverified
SwiftPrune: Hessian-Free Weight Pruning for Large Language Models	Jan 24, 2025	Model CompressionQuantization	—Unverified
HW-SW Optimization of DNNs for Privacy-preserving People Counting on Low-resolution Infrared Arrays	Feb 2, 2024	Neural Architecture SearchPrivacy Preserving	—Unverified
HW-TSC’s Participation in the WMT 2021 Efficiency Shared Task	Nov 1, 2021	CPUDecoder	—Unverified
Hybrid and Non-Uniform DNN quantization methods using Retro Synthesis data for efficient inference	Jan 1, 2021	Quantization	—Unverified
Hybrid and Non-Uniform quantization methods using retro synthesis data for efficient inference	Dec 26, 2020	Quantization	—Unverified
Hybrid Beamforming for Integrated Sensing and Communications With Low Resolution DACs	Nov 5, 2024	ISACQuantization	—Unverified
HybridFlow: Infusing Continuity into Masked Codebook for Extreme Low-Bitrate Image Compression	Apr 20, 2024	DecoderImage Compression	—Unverified
Hybrid model for Single-Stage Multi-Person Pose Estimation	May 2, 2023	Multi-Person Pose EstimationPose Estimation	—Unverified
Hybrid noise shaping for audio coding using perfectly overlapped window	Aug 24, 2023	Quantization	—Unverified
Hybrid of DiffStride and Spectral Pooling in Convolutional Neural Networks	Jan 17, 2024	Quantization	—Unverified
Hybrid Receiver Design for Massive MIMO-OFDM with Low-Resolution ADCs and Oversampling	Jul 5, 2024	Quantization	—Unverified

Show:10 25 50

← PrevPage 97 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified