Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3901–3950 of 4925 papers

Title	Date	Tasks	Status
Progressive Fine-to-Coarse Reconstruction for Accurate Low-Bit Post-Training Quantization in Vision Transformers	Dec 19, 2024	Instance SegmentationPOS	—Unverified
Progressive Mixed-Precision Decoding for Efficient LLM Inference	Oct 17, 2024	Quantization	—Unverified
Progressive Neural Image Compression with Nested Quantization and Latent Ordering	Feb 4, 2021	Image CompressionQuantization	—Unverified
Promoting Data and Model Privacy in Federated Learning through Quantized LoRA	Jun 16, 2024	Federated Learningparameter-efficient fine-tuning	—Unverified
PROM: Prioritize Reduction of Multiplications Over Lower Bit-Widths for Efficient CNNs	May 6, 2025	Quantization	—Unverified
Prompting Large Language Models for Clinical Temporal Relation Extraction	Dec 4, 2024	DecoderQuantization	—Unverified
Prompt Tuning as User Inherent Profile Inference Machine	Aug 13, 2024	QuantizationRecommendation Systems	—Unverified
Proofread: Fixes All Errors with One Tap	Jun 6, 2024	AllQuantization	—Unverified
Protecting Data from all Parties: Combining FHE and DP in Federated Learning	May 9, 2022	AllFederated Learning	—Unverified
Prototype-based classifiers in the presence of concept drift: A modelling framework	Mar 18, 2019	Quantization	—Unverified
Prototype-based Neural Network Layers: Incorporating Vector Quantization	Dec 4, 2018	General Classificationimage-classification	—Unverified
Provable Privacy with Non-Private Pre-Processing	Mar 19, 2024	ImputationQuantization	—Unverified
Provably Communication-efficient Data-parallel SGD via Nonuniform Quantization	Sep 25, 2019	Quantization	—Unverified
Proximity Graph Maintenance for Fast Online Nearest Neighbor Search	Jun 22, 2022	QuantizationRecommendation Systems	—Unverified
ProxyBNN: Learning Binarized Neural Networks via Proxy Matrices	Aug 1, 2020	BinarizationQuantization	—Unverified
Prune Once for All: Sparse Pre-Trained Language Models	Nov 10, 2021	AllNatural Language Inference	—Unverified
Prune or quantize? Strategy for Pareto-optimally low-cost and accurate CNN	Sep 25, 2019	CPUGPU	—Unverified
Pruning and Quantization for Deep Neural Network Acceleration: A Survey	Jan 24, 2021	QuantizationSurvey	—Unverified
Pruning Ternary Quantization	Jul 23, 2021	image-classificationImage Classification	—Unverified
PRUNIX: Non-Ideality Aware Convolutional Neural Network Pruning for Memristive Accelerators	Feb 3, 2022	Network PruningQuantization	—Unverified
PTQ4ADM: Post-Training Quantization for Efficient Text Conditional Audio Diffusion Models	Sep 20, 2024	Audio GenerationAudio Synthesis	—Unverified
PTQ-SL: Exploring the Sub-layerwise Post-training Quantization	Oct 15, 2021	Quantization	—Unverified
Publishing Efficient On-device Models Increases Adversarial Vulnerability	Dec 28, 2022	Quantization	—Unverified
PulseDL-II: A System-on-Chip Neural Network Accelerator for Timing and Energy Extraction of Nuclear Detector Signals	Sep 2, 2022	CPUDeep Learning	—Unverified
Push for Quantization: Deep Fisher Hashing	Aug 31, 2019	QuantizationSemantic Similarity	—Unverified
Pushing Large Language Models to the 6G Edge: Vision, Challenges, and Opportunities	Sep 28, 2023	Edge-computingparameter-efficient fine-tuning	—Unverified
Pushing the boundary on Natural Language Inference	Apr 25, 2025	Fact CheckingInformation Retrieval	—Unverified
Pushing the Envelope of Low-Bit LLM via Dynamic Error Compensation	Dec 28, 2024	CPUGPU	—Unverified
Pushing the Limits of 3D Shape Generation at Scale	Jun 20, 2023	3D Generation3D Shape Generation	—Unverified
In-Distribution Consistency Regularization Improves the Generalization of Quantization-Aware Training	Feb 21, 2024	Knowledge DistillationQuantization	—Unverified
PVGNet: A Bottom-Up One-Stage 3D Object Detector With Integrated Multi-Level Features	Jun 19, 2021	3D Object DetectionObject	—Unverified
PHPQ: Pyramid Hybrid Pooling Quantization for Efficient Fine-Grained Image Retrieval	Sep 11, 2021	Deep HashingImage Retrieval	—Unverified
Pyramid Vector Quantization and Bit Level Sparsity in Weights for Efficient Neural Networks Inference	Nov 24, 2019	Quantization	—Unverified
Pyramid Vector Quantization for Deep Learning	Apr 10, 2017	Deep LearningQuantization	—Unverified
Pyramid Vector Quantization for LLMs	Oct 22, 2024	Quantization	—Unverified
QADAM: Quantization-Aware DNN Accelerator Modeling for Pareto-Optimality	May 20, 2022	Quantization	—Unverified
QAPPA: Quantization-Aware Power, Performance, and Area Modeling of DNN Accelerators	May 17, 2022	Model CompressionQuantization	—Unverified
Q-BERT: Hessian Based Ultra Low Precision Quantization of BERT	Sep 12, 2019	Linguistic AcceptabilityNatural Language Inference	—Unverified
qBitcoin: A Peer-to-Peer Quantum Cash System	Nov 19, 2017	Quantization	—Unverified
QBitOpt: Fast and Accurate Bitwidth Reallocation during Training	Jul 10, 2023	Quantization	—Unverified
Q-CapsNets: A Specialized Framework for Quantizing Capsule Networks	Apr 15, 2020	image-classificationImage Classification	—Unverified
QC-ODKLA: Quantized and Communication-Censored Online Decentralized Kernel Learning via Linearized ADMM	Aug 4, 2022	Quantization	—Unverified
QD-BEV : Quantization-aware View-guided Distillation for Multi-view 3D Object Detection	Aug 21, 2023	3D Object DetectionModel Compression	—Unverified
QDyLoRA: Quantized Dynamic Low-Rank Adaptation for Efficient Large Language Model Tuning	Feb 16, 2024	GPULanguage Modeling	—Unverified
QERA: an Analytical Framework for Quantization Error Reconstruction	Oct 8, 2024	parameter-efficient fine-tuningQuantization	—Unverified
QForce-RL: Quantized FPGA-Optimized Reinforcement Learning Compute Engine	Jun 8, 2025	Decision MakingQuantization	—Unverified
QFT: Post-training quantization via fast joint finetuning of all degrees of freedom	Dec 5, 2022	AllQuantization	—Unverified
QFT: Quantized Full-parameter Tuning of LLMs with Affordable Resources	Oct 11, 2023	GPUparameter-efficient fine-tuning	—Unverified
Q-GADMM: Quantized Group ADMM for Communication Efficient Decentralized Machine Learning	Oct 23, 2019	BIG-bench Machine Learningimage-classification	—Unverified
QGait: Toward Accurate Quantization for Gait Recognition with Binarized Input	May 22, 2024	Gait RecognitionQuantization	—Unverified

Show:10 25 50

← PrevPage 79 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified