Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3901–3925 of 4925 papers

Title	Date	Tasks	Status
Progressive Fine-to-Coarse Reconstruction for Accurate Low-Bit Post-Training Quantization in Vision Transformers	Dec 19, 2024	Instance SegmentationPOS	—Unverified
Progressive Mixed-Precision Decoding for Efficient LLM Inference	Oct 17, 2024	Quantization	—Unverified
Progressive Neural Image Compression with Nested Quantization and Latent Ordering	Feb 4, 2021	Image CompressionQuantization	—Unverified
Promoting Data and Model Privacy in Federated Learning through Quantized LoRA	Jun 16, 2024	Federated Learningparameter-efficient fine-tuning	—Unverified
PROM: Prioritize Reduction of Multiplications Over Lower Bit-Widths for Efficient CNNs	May 6, 2025	Quantization	—Unverified
Prompting Large Language Models for Clinical Temporal Relation Extraction	Dec 4, 2024	DecoderQuantization	—Unverified
Prompt Tuning as User Inherent Profile Inference Machine	Aug 13, 2024	QuantizationRecommendation Systems	—Unverified
Proofread: Fixes All Errors with One Tap	Jun 6, 2024	AllQuantization	—Unverified
Protecting Data from all Parties: Combining FHE and DP in Federated Learning	May 9, 2022	AllFederated Learning	—Unverified
Prototype-based classifiers in the presence of concept drift: A modelling framework	Mar 18, 2019	Quantization	—Unverified
Prototype-based Neural Network Layers: Incorporating Vector Quantization	Dec 4, 2018	General Classificationimage-classification	—Unverified
Provable Privacy with Non-Private Pre-Processing	Mar 19, 2024	ImputationQuantization	—Unverified
Provably Communication-efficient Data-parallel SGD via Nonuniform Quantization	Sep 25, 2019	Quantization	—Unverified
Proximity Graph Maintenance for Fast Online Nearest Neighbor Search	Jun 22, 2022	QuantizationRecommendation Systems	—Unverified
ProxyBNN: Learning Binarized Neural Networks via Proxy Matrices	Aug 1, 2020	BinarizationQuantization	—Unverified
Prune Once for All: Sparse Pre-Trained Language Models	Nov 10, 2021	AllNatural Language Inference	—Unverified
Prune or quantize? Strategy for Pareto-optimally low-cost and accurate CNN	Sep 25, 2019	CPUGPU	—Unverified
Pruning and Quantization for Deep Neural Network Acceleration: A Survey	Jan 24, 2021	QuantizationSurvey	—Unverified
Pruning Ternary Quantization	Jul 23, 2021	image-classificationImage Classification	—Unverified
PRUNIX: Non-Ideality Aware Convolutional Neural Network Pruning for Memristive Accelerators	Feb 3, 2022	Network PruningQuantization	—Unverified
PTQ4ADM: Post-Training Quantization for Efficient Text Conditional Audio Diffusion Models	Sep 20, 2024	Audio GenerationAudio Synthesis	—Unverified
PTQ-SL: Exploring the Sub-layerwise Post-training Quantization	Oct 15, 2021	Quantization	—Unverified
Publishing Efficient On-device Models Increases Adversarial Vulnerability	Dec 28, 2022	Quantization	—Unverified
PulseDL-II: A System-on-Chip Neural Network Accelerator for Timing and Energy Extraction of Nuclear Detector Signals	Sep 2, 2022	CPUDeep Learning	—Unverified
Push for Quantization: Deep Fisher Hashing	Aug 31, 2019	QuantizationSemantic Similarity	—Unverified

Show:10 25 50

← PrevPage 157 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified