Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3651–3700 of 4925 papers

Title	Date	Tasks	Status
Reducing Channel Estimation and Feedback Overhead in IRS-Aided Downlink System: A Quantize-then-Estimate Approach	Aug 4, 2023	Quantization	—Unverified
Quantum Block-Matching Algorithm using Dissimilarity Measure	Sep 27, 2023	ClusteringImage Clustering	—Unverified
AQUILA: Communication Efficient Federated Learning with Adaptive Quantization in Device Selection Strategy	Aug 1, 2023	Federated LearningPrivacy Preserving	—Unverified
Arabic Compact Language Modelling for Resource Limited Devices	Apr 1, 2021	Language ModelingLanguage Modelling	—Unverified
Arbitrary Bit-width Network: A Joint Layer-Wise Quantization and Adaptive Inference Approach	Apr 21, 2022	Quantization	—Unverified
A Reconfigurable Dual-Mode Tracking SAR ADC without Analog Subtraction	May 28, 2019	Quantization	—Unverified
A reconfigurable neural network ASIC for detector front-end data compression at the HL-LHC	May 4, 2021	Data CompressionHigh-Level Synthesis	—Unverified
A Reconstruction-Computation-Quantization (RCQ) Approach to Node Operations in LDPC Decoding	May 14, 2020	DecoderQuantization	—Unverified
Are Conventional SNNs Really Efficient? A Perspective from Network Quantization	Jan 1, 2024	FairnessQuantization	—Unverified
Are disentangled representations all you need to build speaker anonymization systems?	Aug 22, 2022	AllAutomatic Speech Recognition	—Unverified
High-performance deep spiking neural networks with 0.3 spikes per neuron	Jun 14, 2023	image-classificationImage Classification	—Unverified
A review of learning vector quantization classifiers	Sep 23, 2015	Quantization	—Unverified
A Review of Recent Advances of Binary Neural Networks for Edge Computing	Nov 24, 2020	Edge-computingNeural Architecture Search	—Unverified
Are Words the Quanta of Human Language? Extending the Domain of Quantum Cognition	Oct 10, 2021	Cultural Vocal Bursts Intensity PredictionInformation Retrieval	—Unverified
A Rigorous Analysis of Least Squares Sine Fitting Using Quantized Data: the Random Phase Case	Apr 20, 2018	Quantization	—Unverified
ARM 4-BIT PQ: SIMD-based Acceleration for Approximate Nearest Neighbor Search on ARM	Mar 3, 2022	Quantization	—Unverified
A Robust and Low Complexity Deep Learning Model for Remote Sensing Image Classification	Nov 5, 2022	image-classificationImage Classification	—Unverified
A Robust Deep Learning-Based Beamforming Design for RIS-assisted Multiuser MISO Communications with Practical Constraints	Nov 12, 2021	Quantization	—Unverified
A Robust Visual Sampling Model Inspired by Receptive Field	Jan 4, 2022	Quantization	—Unverified
ARQ: A Mixed-Precision Quantization Framework for Accurate and Certifiably Robust DNNs	Oct 31, 2024	Quantization	—Unverified
Art and Science of Quantizing Large-Scale Models: A Comprehensive Overview	Sep 18, 2024	Quantization	—Unverified
Artificial neural networks condensation: A strategy to facilitate adaption of machine learning in medical settings by reducing computational burden	Dec 23, 2018	Computational EfficiencyMortality Prediction	—Unverified
A Safe Self-evolution Algorithm for Autonomous Driving Based on Data-Driven Risk Quantification Model	Aug 23, 2024	Autonomous DrivingEvolutionary Algorithms	—Unverified
A-SDM: Accelerating Stable Diffusion through Redundancy Removal and Performance Optimization	Dec 24, 2023	Quantization	—Unverified
A Secure Federated Learning Framework for Residential Short Term Load Forecasting	Sep 29, 2022	Demand ForecastingFederated Learning	—Unverified
ASER: Activation Smoothing and Error Reconstruction for Large Language Model Quantization	Nov 12, 2024	Language ModelingLanguage Modelling	—Unverified
A SER-based Device Selection Mechanism in Multi-bits Quantization Federated Learning	Apr 20, 2024	Federated LearningQuantization	—Unverified
A Short Note on Analyzing Sequence Complexity in Trajectory Prediction Benchmarks	Mar 27, 2020	QuantizationTrajectory Prediction	—Unverified
A Silicon Photonic Accelerator for Convolutional Neural Networks with Heterogeneous Quantization	May 17, 2022	Quantization	—Unverified
A simple approach for quantizing neural networks	Sep 7, 2022	Quantization	—Unverified
A Simple Contrastive Framework Of Item Tokenization For Generative Recommendation	Jun 20, 2025	Contrastive LearningDescriptive	—Unverified
ASI++: Towards Distributionally Balanced End-to-End Generative Retrieval	May 23, 2024	Information RetrievalQuantization	—Unverified
A SOT-MRAM-based Processing-In-Memory Engine for Highly Compressed DNN Implementation	Nov 24, 2019	Model CompressionQuantization	—Unverified
A Speed Odyssey for Deployable Quantization of LLMs	Nov 16, 2023	Language ModelingLanguage Modelling	—Unverified
Associative Memories to Accelerate Approximate Nearest Neighbor Search	Nov 10, 2016	QuantizationRetrieval	—Unverified
A Structurally Regularized CNN Architecture via Adaptive Subband Decomposition	Jun 29, 2023	image-classificationImage Classification	—Unverified
A Structurally Regularized Convolutional Neural Network for Image Classification using Wavelet-based SubBand Decomposition	Mar 2, 2021	ClassificationGeneral Classification	—Unverified
How Does Batch Normalization Help Binary Training?	Sep 18, 2019	Quantization	—Unverified
A study on speech enhancement using exponent-only floating point quantized neural network (EOFP-QNN)	Aug 17, 2018	Quantizationregression	—Unverified
A Study on Unsupervised Dictionary Learning and Feature Encoding for Action Classification	Sep 2, 2013	Action ClassificationDictionary Learning	—Unverified
A Survey of Low-bit Large Language Models: Basics, Systems, and Algorithms	Sep 25, 2024	Quantization	—Unverified
A Survey of Methods for Low-Power Deep Learning and Computer Vision	Mar 24, 2020	Knowledge DistillationQuantization	—Unverified
A Survey of Model Compression and Acceleration for Deep Neural Networks	Oct 23, 2017	BenchmarkingKnowledge Distillation	—Unverified
A Survey of Quantization Methods for Efficient Neural Network Inference	Mar 25, 2021	Efficient Neural NetworkQuantization	—Unverified
A Survey of Small Language Models	Oct 25, 2024	BenchmarkingModel Compression	—Unverified
A Survey of Techniques for Optimizing Transformer Inference	Jul 16, 2023	Knowledge DistillationNeural Architecture Search	—Unverified
A Survey on Deep Hashing Methods	Mar 4, 2020	Deep HashingDomain Adaptation	—Unverified
A survey on efficient vision transformers: algorithms, techniques, and performance benchmarking	Sep 5, 2023	BenchmarkingKnowledge Distillation	—Unverified
A Survey on Learning to Hash	Jun 1, 2016	QuantizationSurvey	—Unverified
A Survey on Methods and Theories of Quantized Neural Networks	Aug 13, 2018	Quantizationspeech-recognition	—Unverified

Show:10 25 50

← PrevPage 74 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified