Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4376–4400 of 4925 papers

Title	Date	Tasks	Status
Exploring Quantization and Mapping Synergy in Hardware-Aware Deep Neural Network Accelerators	Apr 8, 2024	QuantizationScheduling	CodeCode Available
Quantization for OpenAI's Whisper Models: A Comparative Analysis	Mar 12, 2025	Quantizationspeech-recognition	CodeCode Available
Unveiling Environmental Impacts of Large Language Model Serving: A Functional Unit View	Feb 16, 2025	Language ModelingLanguage Modelling	CodeCode Available
Low-Precision Stochastic Gradient Langevin Dynamics	Jun 20, 2022	Deep LearningQuantization	CodeCode Available
Quantization-Free Autoregressive Action Transformer	Mar 18, 2025	Imitation LearningQuantization	CodeCode Available
Exploring Post-Training Quantization of Protein Language Models	Oct 30, 2023	Protein Structure PredictionQuantization	CodeCode Available
Differentiable Product Quantization for End-to-End Embedding Compression	Aug 26, 2019	Quantization	CodeCode Available
Quantization Guided JPEG Artifact Correction	Apr 17, 2020	Image CompressionJPEG Artifact Correction	CodeCode Available
Wideband and Entropy-Aware Deep Soft Bit Quantization	Oct 18, 2021	Quantization	CodeCode Available
Exploring Embedding Methods in Binary Hyperdimensional Computing: A Case Study for Motor-Imagery based Brain-Computer Interfaces	Dec 13, 2018	Brain Computer InterfaceEEG	CodeCode Available
A Mean Field Theory of Quantized Deep Networks: The Quantization-Depth Trade-Off	Jun 3, 2019	Quantization	CodeCode Available
SC-VAE: Sparse Coding-based Variational Autoencoder with Learned ISTA	Mar 29, 2023	Image GenerationImage Reconstruction	CodeCode Available
Neural Networks with Quantization Constraints	Oct 27, 2022	image-classificationImage Classification	CodeCode Available
Quantization in Spiking Neural Networks	May 13, 2023	Quantization	CodeCode Available
Comprehensive Analysis of the Object Detection Pipeline on UAVs	Mar 1, 2022	Camera Calibrationdistortion correction	CodeCode Available
Low-Precision Random Fourier Features for Memory-Constrained Kernel Approximation	Oct 31, 2018	Quantization	CodeCode Available
Low Precision Decentralized Distributed Training over IID and non-IID Data	Nov 17, 2021	Quantization	CodeCode Available
An Integrated Approach to Produce Robust Models with High Efficiency	Aug 31, 2020	QuantizationVocal Bursts Intensity Prediction	CodeCode Available
Bees Local Phase Quantization Feature Selection for RGB-D Facial Expressions Recognition	Aug 3, 2023	feature selectionQuantization	CodeCode Available
Quantization Networks	Nov 21, 2019	image-classificationImage Classification	CodeCode Available
NeuroSim V1.5: Improved Software Backbone for Benchmarking Compute-in-Memory Accelerators with Device and Circuit-level Non-idealities	May 5, 2025	BenchmarkingQuantization	CodeCode Available
Low dimensional representation of multi-patient flow cytometry datasets using optimal transport for minimal residual disease detection in leukemia	Jul 24, 2024	Dimensionality ReductionPrognosis	CodeCode Available
Accelerating Large-Scale Inference with Anisotropic Vector Quantization	Aug 27, 2019	BenchmarkingQuantization	CodeCode Available
BdSLW60: A Word-Level Bangla Sign Language Dataset	Feb 13, 2024	BenchmarkingGesture Recognition	CodeCode Available
BatchQuant: Quantized-for-all Architecture Search with Robust Quantizer	May 19, 2021	AllGPU	CodeCode Available

Show:10 25 50

← PrevPage 176 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified