Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4326–4350 of 4925 papers

Title	Date	Tasks	Status
Scalable Methods for 8-bit Training of Neural Networks	May 25, 2018	Quantization	CodeCode Available
Benchmarking Post-Training Quantization in LLMs: Comprehensive Taxonomy, Unified Evaluation, and Comparative Analysis	Feb 18, 2025	BenchmarkingMamba	CodeCode Available
Quantitative Analysis of Performance Drop in DeepSeek Model Quantization	May 5, 2025	GPUQuantization	CodeCode Available
Megapixel Image Generation with Step-Unrolled Denoising Autoencoders	Jun 24, 2022	DenoisingGPU	CodeCode Available
Compressed 3D Gaussian Splatting for Accelerated Novel View Synthesis	Nov 17, 2023	GPUNovel View Synthesis	CodeCode Available
Trio-ViT: Post-Training Quantization and Acceleration for Softmax-Free Efficient Vision Transformer	May 6, 2024	Efficient ViTsModel Compression	CodeCode Available
Fast Adjustable Threshold For Uniform Neural Network Quantization (Winning solution of LPIRC-II)	Dec 19, 2018	Quantization	CodeCode Available
FALCON: Feature-Label Constrained Graph Net Collapse for Memory Efficient GNNs	Dec 27, 2023	BenchmarkingGPU	CodeCode Available
Scalable Recognition with a Vocabulary Tree	Jun 22, 2006	QuantizationRetrieval	CodeCode Available
McQueen : Mixed Precision Quantization of Early Exit Networks	Nov 20, 2023	Quantization	CodeCode Available
Make RepVGG Greater Again: A Quantization-aware Approach	Dec 3, 2022	QuantizationSemantic Segmentation	CodeCode Available
Quantization and Deployment of Deep Neural Networks on Microcontrollers	May 27, 2021	Activity RecognitionHuman Activity Recognition	CodeCode Available
Toward Accurate Post-Training Quantization for Image Super Resolution	Jan 1, 2023	Image Super-ResolutionQuantization	CodeCode Available
Maestro: Uncovering Low-Rank Structures via Trainable Decomposition	Aug 28, 2023	Low-rank compressionQuantization	CodeCode Available
Machine Learning at the Wireless Edge: Distributed Stochastic Gradient Descent Over-the-Air	Jan 3, 2019	BIG-bench Machine LearningQuantization	CodeCode Available
FairGLVQ: Fairness in Partition-Based Classification	Oct 16, 2024	ClassificationFairness	CodeCode Available
Unsupervised Panoptic Interpretation of Latent Spaces in GANs Using Space-Filling Vector Quantization	Oct 27, 2024	Data AugmentationQuantization	CodeCode Available
Scalable Verification of Quantized Neural Networks (Technical Report)	Dec 15, 2020	Computational EfficiencyQuantization	CodeCode Available
Natural Quantization of Neural Networks	Mar 19, 2025	Quantization	CodeCode Available
LVPNet: A Latent-variable-based Prediction-driven End-to-end Framework for Lossless Compression of Medical Images	Jun 22, 2025	Image CompressionImage Segmentation	CodeCode Available
Structured Pruning and Quantization for Learned Image Compression	Jun 2, 2025	image-classificationImage Classification	CodeCode Available
Unsupervised Person Re-identification via Softened Similarity Learning	Apr 7, 2020	ClusteringGeneral Classification	CodeCode Available
An Overview of Arithmetic Adaptations for Inference of Convolutional Neural Networks on Re-configurable Hardware	May 19, 2025	Quantization	CodeCode Available
LVLM-Compress-Bench: Benchmarking the Broader Impact of Large Vision-Language Model Compression	Mar 6, 2025	BenchmarkingCommon Sense Reasoning	CodeCode Available
Quantization-aware Interval Bound Propagation for Training Certifiably Robust Quantized Neural Networks	Nov 29, 2022	Adversarial RobustnessGPU	CodeCode Available

Show:10 25 50

← PrevPage 174 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified