Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 951–1000 of 4925 papers

Title	Date	Tasks	Status	Score
Model compression via distillation and quantization	Feb 15, 2018	image-classificationmodel	CodeCode Available	5
Mitigating the Impact of Outlier Channels for Language Model Quantization with Activation Regularization	Apr 4, 2024	GPULanguage Modeling	CodeCode Available	5
Mitigating Quantization Errors Due to Activation Spikes in GLU-Based LLMs	May 23, 2024	Quantization	CodeCode Available	5
Mixed Non-linear Quantization for Vision Transformers	Jul 26, 2024	Quantization	CodeCode Available	5
Minimize Quantization Output Error with Bias Compensation	Apr 2, 2024	Quantization	CodeCode Available	5
MINT: Multiplier-less INTeger Quantization for Energy Efficient Spiking Neural Networks	May 16, 2023	Quantization	CodeCode Available	5
Minimal Random Code Learning: Getting Bits Back from Compressed Model Parameters	Sep 30, 2018	Neural Network CompressionQuantization	CodeCode Available	5
Mirror Descent View for Neural Network Quantization	Oct 18, 2019	Quantizationvalid	CodeCode Available	5
A Simple Low-bit Quantization Framework for Video Snapshot Compressive Imaging	Jul 31, 2024	QuantizationVideo Reconstruction	CodeCode Available	5
Model Compression with Adversarial Robustness: A Unified Optimization Framework	Feb 10, 2019	Adversarial RobustnessModel Compression	CodeCode Available	5
Memory-Driven Mixed Low Precision Quantization For Enabling Deep Network Inference On Microcontrollers	May 30, 2019	Quantization	CodeCode Available	5
Adversarial Fine-tuning of Compressed Neural Networks for Joint Improvement of Robustness and Efficiency	Mar 14, 2024	Adversarial RobustnessModel Compression	CodeCode Available	5
Merge-Friendly Post-Training Quantization for Multi-Target Domain Adaptation	May 29, 2025	Domain AdaptationMulti-target Domain Adaptation	CodeCode Available	5
Continual Learning for Generative Retrieval over Dynamic Corpora	Aug 29, 2023	Continual LearningQuantization	CodeCode Available	5
MetaAug: Meta-Data Augmentation for Post-Training Quantization	Jul 20, 2024	Data AugmentationMeta-Learning	CodeCode Available	5
Compressing Word Embeddings via Deep Compositional Code Learning	Nov 3, 2017	Machine TranslationQuantization	CodeCode Available	5
McQueen : Mixed Precision Quantization of Early Exit Networks	Nov 20, 2023	Quantization	CodeCode Available	5
Megapixel Image Generation with Step-Unrolled Denoising Autoencoders	Jun 24, 2022	DenoisingGPU	CodeCode Available	5
Compressing Vision Transformers for Low-Resource Visual Learning	Sep 5, 2023	Autonomous Navigationimage-classification	CodeCode Available	5
Maestro: Uncovering Low-Rank Structures via Trainable Decomposition	Aug 28, 2023	Low-rank compressionQuantization	CodeCode Available	5
Machine Learning at the Wireless Edge: Distributed Stochastic Gradient Descent Over-the-Air	Jan 3, 2019	BIG-bench Machine LearningQuantization	CodeCode Available	5
Continuous-variable neural-network quantum states and the quantum rotor model	Jul 15, 2021	QuantizationVariational Monte Carlo	CodeCode Available	5
Advanced Knowledge Transfer: Refined Feature Distillation for Zero-Shot Quantization in Edge Computing	Dec 26, 2024	Edge-computingQuantization	CodeCode Available	5
LVPNet: A Latent-variable-based Prediction-driven End-to-end Framework for Lossless Compression of Medical Images	Jun 22, 2025	Image CompressionImage Segmentation	CodeCode Available	5
Compressing 3D Gaussian Splatting by Noise-Substituted Vector Quantization	Apr 3, 2025	3DGS3D Reconstruction	CodeCode Available	5
LVLM-Compress-Bench: Benchmarking the Broader Impact of Large Vision-Language Model Compression	Mar 6, 2025	BenchmarkingCommon Sense Reasoning	CodeCode Available	5
NIRVANA: Neural Implicit Representations of Videos with Adaptive Networks and Autoregressive Patch-wise Modeling	Dec 30, 2022	QuantizationVideo Compression	CodeCode Available	5
NITRO-D: Native Integer-only Training of Deep Convolutional Neural Networks	Jul 16, 2024	Quantization	CodeCode Available	5
Make RepVGG Greater Again: A Quantization-aware Approach	Dec 3, 2022	QuantizationSemantic Segmentation	CodeCode Available	5
LQ-Nets: Learned Quantization for Highly Accurate and Compact Deep Neural Networks	Jul 26, 2018	Quantization	CodeCode Available	5
LRQ: Optimizing Post-Training Quantization for Large Language Models by Learning Low-Rank Weight-Scaling Matrices	Jul 16, 2024	Quantization	CodeCode Available	5
Convert, compress, correct: Three steps toward communication-efficient DNN training	Mar 17, 2022	Quantization	CodeCode Available	5
Compressed Object Detection	Feb 4, 2021	Model CompressionObject	CodeCode Available	5
Low-Precision Stochastic Gradient Langevin Dynamics	Jun 20, 2022	Deep LearningQuantization	CodeCode Available	5
Fast Point Cloud Geometry Compression with Context-based Residual Coding and INR-based Refinement	Aug 6, 2024	Quantization	CodeCode Available	5
Compressed 3D Gaussian Splatting for Accelerated Novel View Synthesis	Nov 17, 2023	GPUNovel View Synthesis	CodeCode Available	5
LSQ++: Lower running time and higher recall in multi-codebook quantization	Sep 1, 2018	Quantization	CodeCode Available	5
Low-bit Model Quantization for Deep Neural Networks: A Survey	May 8, 2025	Quantization	CodeCode Available	5
Convolutional Neural Networks to Enhance Coded Speech	Jun 25, 2018	Quantization	CodeCode Available	5
CoopNet: Cooperative Convolutional Neural Network for Low-Power MCUs	Nov 19, 2019	BinarizationQuantization	CodeCode Available	5
LoTA-QAF: Lossless Ternary Adaptation for Quantization-Aware Fine-Tuning	May 24, 2025	Computational EfficiencyMMLU	CodeCode Available	5
Low-bit Quantization for Deep Graph Neural Networks with Smoothness-aware Message Propagation	Aug 29, 2023	Graph Neural NetworkNode Classification	CodeCode Available	5
Comprehensive SNN Compression Using ADMM Optimization and Activity Regularization	Nov 3, 2019	Model CompressionQuantization	CodeCode Available	5
Low-bit Quantization of Neural Networks for Efficient Inference	Feb 18, 2019	Quantization	CodeCode Available	5
Comprehensive Comparisons of Uniform Quantization in Deep Image Compression	Mar 1, 2023	DecoderImage Compression	CodeCode Available	5
Comprehensive Analysis of the Object Detection Pipeline on UAVs	Mar 1, 2022	Camera Calibrationdistortion correction	CodeCode Available	5
Bit Error Robustness for Energy-Efficient DNN Accelerators	Jun 24, 2020	Quantization	CodeCode Available	5
On Quantizing Neural Representation for Variable-Rate Video Coding	Feb 17, 2025	Quantization	CodeCode Available	5
Compositional Sketch Search	Jun 15, 2021	Image RetrievalPosition	CodeCode Available	5
Composite Quantization	Dec 4, 2017	Quantization	CodeCode Available	5

Show:10 25 50

← PrevPage 20 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified