Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2201–2250 of 4925 papers

Title	Date	Tasks	Status
An Adaptive Device-Edge Co-Inference Framework Based on Soft Actor-Critic	Jan 9, 2022	CPUDeep Reinforcement Learning	—Unverified
A Counterexample in Cross-Correlation Template Matching	Oct 24, 2024	Image RegistrationQuantization	—Unverified
JAQ: Joint Efficient Architecture Design and Low-Bit Quantization with Hardware-Software Co-Exploration	Jan 9, 2025	Quantization	—Unverified
Development of Quantized DNN Library for Exact Hardware Emulation	Jun 15, 2021	Quantization	—Unverified
Development of a Thermodynamics of Human Cognition and Human Culture	Dec 24, 2022	Cultural Vocal Bursts Intensity PredictionInformation Retrieval	—Unverified
BEAST: Efficient Tokenization of B-Splines Encoded Action Sequences for Imitation Learning	Jun 6, 2025	continuous-controlContinuous Control	—Unverified
AMXFP4: Taming Activation Outliers with Asymmetric Microscaling Floating-Point for 4-bit LLM Inference	Nov 15, 2024	QuantizationQuestion Answering	—Unverified
结合遗传算法的LVQ神经网络在声学底质分类中的应用	May 1, 2007	Quantization	—Unverified
Detection of small changes in medical and random-dot images comparing self-organizing map performance to human detection	Jun 26, 2019	Decision MakingHuman Detection	—Unverified
BeamVQ: Aligning Space-Time Forecasting Model via Self-training on Physics-aware Metrics	May 27, 2024	DecoderQuantization	—Unverified
A 71.2-μW Speech Recognition Accelerator with Recurrent Spiking Neural Network	Mar 27, 2025	Quantizationspeech-recognition	—Unverified
DHNet: Double MPEG-4 Compression Detection via Multiple DCT Histograms	Jul 19, 2021	Quantization	—Unverified
Detecting Face Synthesis Using a Concealed Fusion Model	Jan 8, 2024	Computer SecurityFace Generation	—Unverified
A Cost-Efficient FPGA Implementation of Tiny Transformer Model using Neural ODE	Jan 5, 2024	CPUEdge-computing	—Unverified
Detecting Dead Weights and Units in Neural Networks	Jun 15, 2018	Quantization	—Unverified
BdSLW401: Transformer-Based Word-Level Bangla Sign Language Recognition Using Relative Quantization Encoding (RQE)	Mar 4, 2025	QuantizationSign Language Recognition	—Unverified
A multi-layer image representation using Regularized Residual Quantization: application to compression and denoising	Jul 7, 2017	DenoisingQuantization	—Unverified
Design Space Exploration of Low-Bit Quantized Neural Networks for Visual Place Recognition	Dec 14, 2023	QuantizationVisual Place Recognition	—Unverified
Design Space Exploration of Dense and Sparse Mapping Schemes for RRAM Architectures	Jan 18, 2022	Quantization	—Unverified
BDD4BNN: A BDD-based Quantitative Analysis Framework for Binarized Neural Networks	Mar 12, 2021	Quantization	—Unverified
J3DAI: A tiny DNN-Based Edge AI Accelerator for 3D-Stacked CMOS Image Sensor	Jun 18, 2025	image-classificationImage Classification	—Unverified
HVS-Based Perceptual Color Compression of Image Data	May 16, 2020	AllMS-SSIM	—Unverified
Design of Stochastic Quantizers for Privacy Preservation	Mar 5, 2024	Privacy PreservingQuantization	—Unverified
Design of Sampling Set for Bandlimited Graph Signal Estimation	Nov 20, 2017	Experimental DesignQuantization	—Unverified
Design of High-Throughput Mixed-Precision CNN Accelerators on FPGA	Aug 9, 2022	QuantizationVocal Bursts Intensity Prediction	—Unverified
BBQRec: Behavior-Bind Quantization for Multi-Modal Sequential Recommendation	Apr 9, 2025	QuantizationRecommendation Systems	—Unverified
A Modular Neural Network Based Deep Learning Approach for MIMO Signal Detection	Apr 1, 2020	Quantization	—Unverified
Designing strong baselines for ternary neural network quantization through support and mass equalization	Jun 30, 2023	Quantization	—Unverified
Designing DNNs for a trade-off between robustness and processing performance in embedded devices	Dec 4, 2024	Autonomous DrivingQuantization	—Unverified
b-bit Marginal Regression	Dec 1, 2015	Quantizationregression	—Unverified
Designing Discontinuities	May 15, 2023	EconometricsQuantization	—Unverified
Designing a Classifier for Active Fire Detection from Multispectral Satellite Imagery Using Neural Architecture Search	Oct 7, 2024	Fire DetectionNeural Architecture Search	—Unverified
Bayes Merging of Multiple Vocabularies for Scalable Image Retrieval	Mar 3, 2014	Image RetrievalQuantization	—Unverified
A Compressed Sensing Approach for Distribution Matching	Apr 2, 2018	Bayesian Inferencecompressed sensing	—Unverified
A 65nm 8b-Activation 8b-Weight SRAM-Based Charge-Domain Computing-in-Memory Macro Using A Fully-Parallel Analog Adder Network and A Single-ADC Interface	Nov 23, 2022	Quantization	—Unverified
Design Flow of Accelerating Hybrid Extremely Low Bit-width Neural Network in Embedded FPGA	Jul 31, 2018	Edge-computingGPU	—Unverified
Design Automation for Efficient Deep Learning Computing	Apr 24, 2019	Deep LearningQuantization	—Unverified
Bayesian-LoRA: LoRA based Parameter Efficient Fine-Tuning using Optimal Quantization levels and Rank Values trough Differentiable Bayesian Gates	Jun 18, 2024	parameter-efficient fine-tuningQuantization	—Unverified
Design and Analysis of Uplink and Downlink Communications for Federated Learning	Dec 7, 2020	Federated LearningQuantization	—Unverified
Design and Analysis of Hardware-limited Non-uniform Task-based Quantizers	Aug 16, 2022	Quantization	—Unverified
A method of using RSVD in residual calculation of LowBit GEMM	Sep 27, 2024	Data Free QuantizationQuantization	—Unverified
DeRS: Towards Extremely Efficient Upcycled Mixture-of-Experts Models	Mar 3, 2025	Mixture-of-ExpertsQuantization	—Unverified
Derived Codebooks for High-Accuracy Nearest Neighbor Search	May 16, 2019	QuantizationVocal Bursts Intensity Prediction	—Unverified
A Comprehensive Survey on Vector Database: Storage and Retrieval Technique, Challenge	Oct 18, 2023	ArticlesQuantization	—Unverified
Dequantization of a signal from two parallel quantized observations	Sep 12, 2024	Quantization	—Unverified
Breaking the Hourglass Phenomenon of Residual Quantization: Enhancing the Upper Bound of Generative Retrieval	Jul 31, 2024	QuantizationRecommendation Systems	—Unverified
Iteratively Training Look-Up Tables for Network Quantization	Nov 13, 2018	object-detectionObject Detection	—Unverified
Iteratively Training Look-Up Tables for Network Quantization	Nov 12, 2019	Network PruningQuantization	—Unverified
Iterative Signal Processing for Integrated Sensing and Communication Systems	Jun 8, 2023	Integrated sensing and communicationISAC	—Unverified
JND-Based Perceptual Optimization For Learned Image Compression	Feb 25, 2023	Image CompressionMS-SSIM	—Unverified

Show:10 25 50

← PrevPage 45 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified