Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4876–4900 of 4925 papers

Title	Date	Tasks	Status
General Point Model Pretraining with Autoencoding and Autoregressive	Jan 1, 2024	DecoderLanguage Modeling	CodeCode Available
Conditional Probability Models for Deep Image Compression	Jan 12, 2018	Image CompressionMS-SSIM	CodeCode Available
Applying generative neural networks for fast simulations of the ALICE (CERN) experiment	Jul 10, 2024	Quantization	CodeCode Available
Computational data analysis for first quantization estimation on JPEG double compressed images	Jan 10, 2021	Quantization	CodeCode Available
Compressing Word Embeddings via Deep Compositional Code Learning	Nov 3, 2017	Machine TranslationQuantization	CodeCode Available
Generalized Relevance Learning Grassmann Quantization	Mar 14, 2024	Activity RecognitionFace Recognition	CodeCode Available
Fate: Fast Edge Inference of Mixture-of-Experts Models via Cross-Layer Gate	Feb 17, 2025	GPUMixture-of-Experts	CodeCode Available
Generalized Learning Vector Quantization for Classification in Randomized Neural Networks and Hyperdimensional Computing	Jun 17, 2021	BIG-bench Machine LearningQuantization	CodeCode Available
Robustness Analysis of Deep Learning Frameworks on Mobile Platforms	Sep 20, 2021	BIG-bench Machine LearningDeep Learning	CodeCode Available
GANQ: GPU-Adaptive Non-Uniform Quantization for Large Language Models	Jan 22, 2025	GPUQuantization	CodeCode Available
FTT-NAS: Discovering Fault-Tolerant Convolutional Neural Architecture	Mar 20, 2020	Neural Architecture SearchQuantization	CodeCode Available
FPQVAR: Floating Point Quantization for Visual Autoregressive Model with FPGA Hardware Co-design	May 22, 2025	GPUImage Generation	CodeCode Available
FP4DiT: Towards Effective Floating Point Quantization for Diffusion Transformers	Mar 19, 2025	Image GenerationQuantization	CodeCode Available
Compressing Vision Transformers for Low-Resource Visual Learning	Sep 5, 2023	Autonomous Navigationimage-classification	CodeCode Available
Does quantization affect models' performance on long-context tasks?	May 26, 2025	Quantization	CodeCode Available
Dequantization and Color Transfer with Diffusion Models	Jul 6, 2023	ColorizationImage Colorization	CodeCode Available
Accurate and Efficient Fine-Tuning of Quantized Large Language Models Through Optimal Balance	Jul 24, 2024	Quantization	CodeCode Available
Foundations of Large Language Model Compression -- Part 1: Weight Quantization	Sep 3, 2024	Language ModelingLanguage Modelling	CodeCode Available
Robustness of Generalized Learning Vector Quantization Models against Adversarial Attacks	Feb 1, 2019	Quantization	CodeCode Available
Q&C: When Quantization Meets Cache in Efficient Image Generation	Mar 4, 2025	Image GenerationQuantization	CodeCode Available
ACCEPT: Adaptive Codebook for Composite and Efficient Prompt Tuning	Oct 10, 2024	Natural Language Understandingparameter-efficient fine-tuning	CodeCode Available
FLoCoRA: Federated learning compression with low-rank adaptation	Jun 20, 2024	Federated LearningModel Compression	CodeCode Available
Floating-Point Quantization Analysis of Multi-Layer Perceptron Artificial Neural Networks	Mar 18, 2024	Quantization	CodeCode Available
FlexRound: Learnable Rounding based on Element-wise Division for Post-Training Quantization	Jun 1, 2023	image-classificationImage Classification	CodeCode Available
Flexible Mixed Precision Quantization for Learned Image Compression	Jun 2, 2025	Image CompressionQuantization	CodeCode Available

Show:10 25 50

← PrevPage 196 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified