Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4501–4550 of 4925 papers

Title	Date	Tasks	Status
Quantizing deep convolutional networks for efficient inference: A whitepaper	Jun 21, 2018	Quantization	CodeCode Available
A2Q: Accumulator-Aware Quantization with Guaranteed Overflow Avoidance	Aug 25, 2023	Quantization	CodeCode Available
Deep residual network for steganalysis of digital images	Sep 23, 2018	Image SteganographyQuantization	CodeCode Available
LegalEval-Q: A New Benchmark for The Quality Evaluation of LLM-Generated Legal Text	May 30, 2025	Quantization	CodeCode Available
Ultrafast jet classification on FPGAs for the HL-LHC	Feb 2, 2024	Quantization	CodeCode Available
Large Scale Clustering with Variational EM for Gaussian Mixture Models	Oct 1, 2018	BenchmarkingClustering	CodeCode Available
QuantNAS for super resolution: searching for efficient quantization-friendly architectures against quantization noise	Aug 31, 2022	Efficient Neural NetworkImage Super-Resolution	CodeCode Available
Towards Learning of Filter-Level Heterogeneous Compression of Convolutional Neural Networks	Apr 22, 2019	Network PruningNeural Architecture Search	CodeCode Available
AdaBits: Neural Network Quantization with Adaptive Bit-Widths	Dec 20, 2019	Quantization	CodeCode Available
Bit Error Robustness for Energy-Efficient DNN Accelerators	Jun 24, 2020	Quantization	CodeCode Available
Towards Lossless ANN-SNN Conversion under Ultra-Low Latency with Dual-Phase Optimization	May 16, 2022	object-detectionObject Detection	CodeCode Available
Communication-Efficient Distributed Blockwise Momentum SGD with Error-Feedback	May 27, 2019	Quantization	CodeCode Available
Deep Recurrent Quantization for Generating Sequential Binary Codes	Jun 16, 2019	Image RetrievalQuantization	CodeCode Available
Exact Backpropagation in Binary Weighted Networks with Group Weight Transformations	Jul 3, 2021	BinarizationClassification with Binary Weight Network	CodeCode Available
Automated Cancer Subtyping via Vector Quantization Mutual Information Maximization	Jun 22, 2022	ClusteringQuantization	CodeCode Available
Deep Priority Hashing	Sep 4, 2018	Deep HashingImage Retrieval	CodeCode Available
On Quantizing Neural Representation for Variable-Rate Video Coding	Feb 17, 2025	Quantization	CodeCode Available
Evaluating Single Event Upsets in Deep Neural Networks for Semantic Segmentation: an embedded system perspective	Dec 4, 2024	Autonomous DrivingQuantization	CodeCode Available
Evaluating Quantized Large Language Models for Code Generation on Low-Resource Language Benchmarks	Oct 18, 2024	Code GenerationGPU	CodeCode Available
On Resource-Efficient Bayesian Network Classifiers and Deep Neural Networks	Oct 22, 2020	Quantization	CodeCode Available
Communication-Censored Distributed Stochastic Gradient Descent	Sep 9, 2019	QuantizationStochastic Optimization	CodeCode Available
Agile-Quant: Activation-Guided Quantization for Faster Inference of LLMs on the Edge	Dec 9, 2023	Language ModelingLanguage Modelling	CodeCode Available
Evaluating Large Language Models on the Frame and Symbol Grounding Problems: A Zero-shot Benchmark	Jun 9, 2025	Quantization	CodeCode Available
Deep Optimized Multiple Description Image Coding via Scalar Quantization Learning	Jan 12, 2020	DecoderQuantization	CodeCode Available
SHE: A Fast and Accurate Deep Neural Network for Encrypted Data	Jun 1, 2019	Quantization	CodeCode Available
On the Discrepancy between the Theoretical Analysis and Practical Implementations of Compressed Communication for Distributed Deep Learning	Nov 19, 2019	Model CompressionQuantization	CodeCode Available
Estimation and Restoration of Unknown Nonlinear Distortion using Diffusion	Jan 10, 2025	Audio Effects ModelingQuantization	CodeCode Available
On the Downstream Performance of Compressed Word Embeddings	Sep 3, 2019	Generalization BoundsQuantization	CodeCode Available
ES-ENAS: Efficient Evolutionary Optimization for Large Hybrid Search Spaces	Jan 19, 2021	Combinatorial OptimizationContinuous Control	CodeCode Available
Quicker ADC : Unlocking the hidden potential of Product Quantization with SIMD	Dec 21, 2018	QuantizationRetrieval	CodeCode Available
Deep Neural Network for Respiratory Sound Classification in Wearable Devices Enabled by Patient Specific Model Tuning	Apr 16, 2020	Anomaly DetectionGeneral Classification	CodeCode Available
Error Diffusion Halftoning Against Adversarial Examples	Jan 23, 2021	Adversarial RobustnessQuantization	CodeCode Available
ShiftCNN: Generalized Low-Precision Architecture for Inference of Convolutional Neural Networks	Jun 7, 2017	Quantization	CodeCode Available
On the Impact of Black-box Deployment Strategies for Edge AI on Latency and Model Performance	Mar 25, 2024	CPUQuantization	CodeCode Available
Unbounded cache model for online language modeling with open vocabulary	Nov 7, 2017	Language ModelingLanguage Modelling	CodeCode Available
Error Correcting Output Codes Improve Probability Estimation and Adversarial Robustness of Deep Neural Networks	Dec 1, 2019	Adversarial DefenseAdversarial Robustness	CodeCode Available
Equal Bits: Enforcing Equally Distributed Binary Network Weights	Dec 2, 2021	BinarizationQuantization	CodeCode Available
Shifting Capsule Networks from the Cloud to the Deep Edge	Oct 6, 2021	Quantization	CodeCode Available
4bit-Quantization in Vector-Embedding for RAG	Jan 17, 2025	QuantizationRAG	CodeCode Available
QuSecNets: Quantization-based Defense Mechanism for Securing Deep Neural Network against Adversarial Attacks	Nov 4, 2018	Quantization	CodeCode Available
Deep Neural Network Compression with Single and Multiple Level Quantization	Mar 6, 2018	Neural Network CompressionQuantization	CodeCode Available
QVIP: An ILP-based Formal Verification Approach for Quantized Neural Networks	Dec 10, 2022	Quantization	CodeCode Available
On the Perturbed States for Transformed Input-robust Reinforcement Learning	Jul 31, 2024	DenoisingMuJoCo	CodeCode Available
enpheeph: A Fault Injection Framework for Spiking and Compressed Deep Neural Networks	Jul 31, 2022	Autonomous DrivingQuantization	CodeCode Available
Enhancing Low-Precision Sampling via Stochastic Gradient Hamiltonian Monte Carlo	Oct 25, 2023	QuantizationUncertainty Quantification	CodeCode Available
End-to-end Learning of Deep Visual Representations for Image Retrieval	Oct 25, 2016	Image RetrievalQuantization	CodeCode Available
End-to-End Human Pose Reconstruction from Wearable Sensors for 6G Extended Reality Systems	Mar 6, 2025	Quantization	CodeCode Available
DIVISION: Memory Efficient Training via Dual Activation Precision	Aug 5, 2022	Quantization	CodeCode Available
EncodingNet: A Novel Encoding-based MAC Design for Efficient Neural Network Acceleration	Feb 25, 2024	Efficient Neural Networkimage-classification	CodeCode Available
QWID: Quantized Weed Identification Deep neural network	Oct 29, 2023	QuantizationTransfer Learning	CodeCode Available

Show:10 25 50

← PrevPage 91 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified