Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4351–4400 of 4925 papers

Title	Date	Tasks	Status
LSQ++: Lower running time and higher recall in multi-codebook quantization	Sep 1, 2018	Quantization	CodeCode Available
Nearly Lossless Adaptive Bit Switching	Feb 3, 2025	Quantization	CodeCode Available
Scaling Image Tokenizers with Grouped Spherical Quantization	Dec 3, 2024	Quantization	CodeCode Available
Additive Noise Annealing and Approximation Properties of Quantized Neural Networks	May 24, 2019	image-classificationImage Classification	CodeCode Available
Discrete Cross-Modal Alignment Enables Zero-Shot Speech Translation	Oct 18, 2022	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
NestQuant: Post-Training Integer-Nesting Quantization for On-Device DNN	Jun 22, 2025	Quantization	CodeCode Available
LRQ: Optimizing Post-Training Quantization for Large Language Models by Learning Low-Rank Weight-Scaling Matrices	Jul 16, 2024	Quantization	CodeCode Available
Who's a Good Boy? Reinforcing Canine Behavior in Real-Time using Machine Learning	Jan 7, 2021	BIG-bench Machine Learningimage-classification	CodeCode Available
Unsupervised Speech Representation Pooling Using Vector Quantization	Apr 8, 2023	Emotion Recognitionintent-classification	CodeCode Available
xCOMET-lite: Bridging the Gap Between Efficiency and Quality in Learned MT Evaluation Metrics	Jun 20, 2024	Machine TranslationQuantization	CodeCode Available
LQ-Nets: Learned Quantization for Highly Accurate and Compact Deep Neural Networks	Jul 26, 2018	Quantization	CodeCode Available
Discrete, compositional, and symbolic representations through attractor dynamics	Oct 3, 2023	Quantization	CodeCode Available
NeUQI: Near-Optimal Uniform Quantization Parameter Initialization	May 23, 2025	Quantization	CodeCode Available
DiscQuant: A Quantization Method for Neural Networks Inspired by Discrepancy Theory	Jan 11, 2025	GSM8KQuantization	CodeCode Available
Neural Architecture Codesign for Fast Physics Applications	Jan 9, 2025	High-Level SynthesisModel Compression	CodeCode Available
Quantization-Based Regularization for Autoencoders	May 27, 2019	ClusteringDecoder	CodeCode Available
Digital and Hybrid Precoding Designs in Massive MIMO with Low-Resolution ADCs	Sep 26, 2024	Quantization	CodeCode Available
Quantization Effects on Neural Networks Perception: How would quantization change the perceptual field of vision models?	Mar 15, 2024	Quantization	CodeCode Available
Diffusion Models as Stochastic Quantization in Lattice Field Theory	Sep 29, 2023	Quantization	CodeCode Available
Comprehensive SNN Compression Using ADMM Optimization and Activity Regularization	Nov 3, 2019	Model CompressionQuantization	CodeCode Available
Comprehensive Comparisons of Uniform Quantization in Deep Image Compression	Mar 1, 2023	DecoderImage Compression	CodeCode Available
Extracting Usable Predictions from Quantized Networks through Uncertainty Quantification for OOD Detection	Mar 2, 2024	QuantizationUncertainty Quantification	CodeCode Available
Neural Network Activation Quantization with Bitwise Information Bottlenecks	Jun 9, 2020	Computational EfficiencyQuantization	CodeCode Available
Differentiable Soft Quantization: Bridging Full-Precision and Low-Bit Neural Networks	Aug 14, 2019	Quantization	CodeCode Available
Neural Network Assisted Lifting Steps For Improved Fully Scalable Lossy Image Compression in JPEG 2000	Mar 4, 2024	Image CompressionQuantization	CodeCode Available
Exploring Quantization and Mapping Synergy in Hardware-Aware Deep Neural Network Accelerators	Apr 8, 2024	QuantizationScheduling	CodeCode Available
Quantization for OpenAI's Whisper Models: A Comparative Analysis	Mar 12, 2025	Quantizationspeech-recognition	CodeCode Available
Unveiling Environmental Impacts of Large Language Model Serving: A Functional Unit View	Feb 16, 2025	Language ModelingLanguage Modelling	CodeCode Available
Low-Precision Stochastic Gradient Langevin Dynamics	Jun 20, 2022	Deep LearningQuantization	CodeCode Available
Quantization-Free Autoregressive Action Transformer	Mar 18, 2025	Imitation LearningQuantization	CodeCode Available
Exploring Post-Training Quantization of Protein Language Models	Oct 30, 2023	Protein Structure PredictionQuantization	CodeCode Available
Differentiable Product Quantization for End-to-End Embedding Compression	Aug 26, 2019	Quantization	CodeCode Available
Quantization Guided JPEG Artifact Correction	Apr 17, 2020	Image CompressionJPEG Artifact Correction	CodeCode Available
Wideband and Entropy-Aware Deep Soft Bit Quantization	Oct 18, 2021	Quantization	CodeCode Available
Exploring Embedding Methods in Binary Hyperdimensional Computing: A Case Study for Motor-Imagery based Brain-Computer Interfaces	Dec 13, 2018	Brain Computer InterfaceEEG	CodeCode Available
A Mean Field Theory of Quantized Deep Networks: The Quantization-Depth Trade-Off	Jun 3, 2019	Quantization	CodeCode Available
SC-VAE: Sparse Coding-based Variational Autoencoder with Learned ISTA	Mar 29, 2023	Image GenerationImage Reconstruction	CodeCode Available
Neural Networks with Quantization Constraints	Oct 27, 2022	image-classificationImage Classification	CodeCode Available
Quantization in Spiking Neural Networks	May 13, 2023	Quantization	CodeCode Available
Comprehensive Analysis of the Object Detection Pipeline on UAVs	Mar 1, 2022	Camera Calibrationdistortion correction	CodeCode Available
Low-Precision Random Fourier Features for Memory-Constrained Kernel Approximation	Oct 31, 2018	Quantization	CodeCode Available
Low Precision Decentralized Distributed Training over IID and non-IID Data	Nov 17, 2021	Quantization	CodeCode Available
An Integrated Approach to Produce Robust Models with High Efficiency	Aug 31, 2020	QuantizationVocal Bursts Intensity Prediction	CodeCode Available
Bees Local Phase Quantization Feature Selection for RGB-D Facial Expressions Recognition	Aug 3, 2023	feature selectionQuantization	CodeCode Available
Quantization Networks	Nov 21, 2019	image-classificationImage Classification	CodeCode Available
NeuroSim V1.5: Improved Software Backbone for Benchmarking Compute-in-Memory Accelerators with Device and Circuit-level Non-idealities	May 5, 2025	BenchmarkingQuantization	CodeCode Available
Low dimensional representation of multi-patient flow cytometry datasets using optimal transport for minimal residual disease detection in leukemia	Jul 24, 2024	Dimensionality ReductionPrognosis	CodeCode Available
Accelerating Large-Scale Inference with Anisotropic Vector Quantization	Aug 27, 2019	BenchmarkingQuantization	CodeCode Available
BdSLW60: A Word-Level Bangla Sign Language Dataset	Feb 13, 2024	BenchmarkingGesture Recognition	CodeCode Available
BatchQuant: Quantized-for-all Architecture Search with Robust Quantizer	May 19, 2021	AllGPU	CodeCode Available

Show:10 25 50

← PrevPage 88 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified