Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 901–950 of 4925 papers

Title	Date	Tasks	Status	Score
Neural Network Activation Quantization with Bitwise Information Bottlenecks	Jun 9, 2020	Computational EfficiencyQuantization	CodeCode Available	5
Neural Architecture Codesign for Fast Physics Applications	Jan 9, 2025	High-Level SynthesisModel Compression	CodeCode Available	5
Neural Network Assisted Lifting Steps For Improved Fully Scalable Lossy Image Compression in JPEG 2000	Mar 4, 2024	Image CompressionQuantization	CodeCode Available	5
NestQuant: Post-Training Integer-Nesting Quantization for On-Device DNN	Jun 22, 2025	Quantization	CodeCode Available	5
Nearly Lossless Adaptive Bit Switching	Feb 3, 2025	Quantization	CodeCode Available	5
NeUQI: Near-Optimal Uniform Quantization Parameter Initialization	May 23, 2025	Quantization	CodeCode Available	5
Aggregated Learning: A Vector-Quantization Approach to Learning Neural Network Classifiers	Jan 12, 2020	ClassificationGeneral Classification	CodeCode Available	5
Multi-Excitation Projective Simulation with a Many-Body Physics Inspired Inductive Bias	Feb 15, 2024	Explainable artificial intelligenceExplainable Artificial Intelligence (XAI)	CodeCode Available	5
4bit-Quantization in Vector-Embedding for RAG	Jan 17, 2025	QuantizationRAG	CodeCode Available	5
Multi-Class Uncertainty Calibration via Mutual Information Maximization-based Binning	Jun 23, 2020	Quantization	CodeCode Available	5
Natural Quantization of Neural Networks	Mar 19, 2025	Quantization	CodeCode Available	5
Fate: Fast Edge Inference of Mixture-of-Experts Models via Cross-Layer Gate	Feb 17, 2025	GPUMixture-of-Experts	CodeCode Available	5
Monocular Depth Estimation with Hierarchical Fusion of Dilated CNNs and Soft-Weighted-Sum Inference	Aug 2, 2017	Depth EstimationMonocular Depth Estimation	CodeCode Available	5
MorpheusNet: Resource efficient sleep stage classifier for embedded on-line systems	Jan 14, 2024	Quantization	CodeCode Available	5
Modulated Diffusion: Accelerating Generative Modeling with Modulated Quantization	Jun 18, 2025	Quantization	CodeCode Available	5
Modular Quantization-Aware Training for 6D Object Pose Estimation	Mar 12, 2023	6D Pose Estimation6D Pose Estimation using RGB	CodeCode Available	5
MotionAura: Generating High-Quality and Motion Consistent Videos using Discrete Diffusion	Oct 10, 2024	Denoisingparameter-efficient fine-tuning	CodeCode Available	5
Model-Aware Deep Architectures for One-Bit Compressive Variational Autoencoding	Nov 27, 2019	Compressive SensingQuantization	CodeCode Available	5
Model Compression Techniques in Biometrics Applications: A Survey	Jan 18, 2024	FairnessKnowledge Distillation	CodeCode Available	5
Model compression via distillation and quantization	Feb 15, 2018	image-classificationmodel	CodeCode Available	5
Mixed-TD: Efficient Neural Network Accelerator with Layer-Specific Tensor Decomposition	Jun 8, 2023	Efficient Neural NetworkQuantization	CodeCode Available	5
Mixed-Precision Quantization and Parallel Implementation of Multispectral Riemannian Classification for Brain--Machine Interfaces	Feb 22, 2021	General ClassificationMotor Imagery	CodeCode Available	5
Mitigating the Impact of Outlier Channels for Language Model Quantization with Activation Regularization	Apr 4, 2024	GPULanguage Modeling	CodeCode Available	5
Computational data analysis for first quantization estimation on JPEG double compressed images	Jan 10, 2021	Quantization	CodeCode Available	5
Mixed Non-linear Quantization for Vision Transformers	Jul 26, 2024	Quantization	CodeCode Available	5
Mixed-Precision Quantization for Deep Vision Models with Integer Quadratic Programming	Jul 11, 2023	QuantizationSensitivity	CodeCode Available	5
MINT: Multiplier-less INTeger Quantization for Energy Efficient Spiking Neural Networks	May 16, 2023	Quantization	CodeCode Available	5
Minimal Random Code Learning: Getting Bits Back from Compressed Model Parameters	Sep 30, 2018	Neural Network CompressionQuantization	CodeCode Available	5
Mirror Descent View for Neural Network Quantization	Oct 18, 2019	Quantizationvalid	CodeCode Available	5
Accurate and Efficient Fine-Tuning of Quantized Large Language Models Through Optimal Balance	Jul 24, 2024	Quantization	CodeCode Available	5
MetaAug: Meta-Data Augmentation for Post-Training Quantization	Jul 20, 2024	Data AugmentationMeta-Learning	CodeCode Available	5
Memory-Driven Mixed Low Precision Quantization For Enabling Deep Network Inference On Microcontrollers	May 30, 2019	Quantization	CodeCode Available	5
Merge-Friendly Post-Training Quantization for Multi-Target Domain Adaptation	May 29, 2025	Domain AdaptationMulti-target Domain Adaptation	CodeCode Available	5
McQueen : Mixed Precision Quantization of Early Exit Networks	Nov 20, 2023	Quantization	CodeCode Available	5
Megapixel Image Generation with Step-Unrolled Denoising Autoencoders	Jun 24, 2022	DenoisingGPU	CodeCode Available	5
Mitigating Quantization Errors Due to Activation Spikes in GLU-Based LLMs	May 23, 2024	Quantization	CodeCode Available	5
A Simple Low-bit Quantization Framework for Video Snapshot Compressive Imaging	Jul 31, 2024	QuantizationVideo Reconstruction	CodeCode Available	5
Model Compression with Adversarial Robustness: A Unified Optimization Framework	Feb 10, 2019	Adversarial RobustnessModel Compression	CodeCode Available	5
Make RepVGG Greater Again: A Quantization-aware Approach	Dec 3, 2022	QuantizationSemantic Segmentation	CodeCode Available	5
Maestro: Uncovering Low-Rank Structures via Trainable Decomposition	Aug 28, 2023	Low-rank compressionQuantization	CodeCode Available	5
Minimize Quantization Output Error with Bias Compensation	Apr 2, 2024	Quantization	CodeCode Available	5
Adversarial Fine-tuning of Compressed Neural Networks for Joint Improvement of Robustness and Efficiency	Mar 14, 2024	Adversarial RobustnessModel Compression	CodeCode Available	5
LVPNet: A Latent-variable-based Prediction-driven End-to-end Framework for Lossless Compression of Medical Images	Jun 22, 2025	Image CompressionImage Segmentation	CodeCode Available	5
Compressing Word Embeddings via Deep Compositional Code Learning	Nov 3, 2017	Machine TranslationQuantization	CodeCode Available	5
LSQ++: Lower running time and higher recall in multi-codebook quantization	Sep 1, 2018	Quantization	CodeCode Available	5
LVLM-Compress-Bench: Benchmarking the Broader Impact of Large Vision-Language Model Compression	Mar 6, 2025	BenchmarkingCommon Sense Reasoning	CodeCode Available	5
Machine Learning at the Wireless Edge: Distributed Stochastic Gradient Descent Over-the-Air	Jan 3, 2019	BIG-bench Machine LearningQuantization	CodeCode Available	5
Compressing Vision Transformers for Low-Resource Visual Learning	Sep 5, 2023	Autonomous Navigationimage-classification	CodeCode Available	5
LQ-Nets: Learned Quantization for Highly Accurate and Compact Deep Neural Networks	Jul 26, 2018	Quantization	CodeCode Available	5
LRQ: Optimizing Post-Training Quantization for Large Language Models by Learning Low-Rank Weight-Scaling Matrices	Jul 16, 2024	Quantization	CodeCode Available	5

Show:10 25 50

← PrevPage 19 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified