Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3926–3950 of 4925 papers

Title	Date	Tasks	Status
Pushing Large Language Models to the 6G Edge: Vision, Challenges, and Opportunities	Sep 28, 2023	Edge-computingparameter-efficient fine-tuning	—Unverified
Pushing the boundary on Natural Language Inference	Apr 25, 2025	Fact CheckingInformation Retrieval	—Unverified
Pushing the Envelope of Low-Bit LLM via Dynamic Error Compensation	Dec 28, 2024	CPUGPU	—Unverified
Pushing the Limits of 3D Shape Generation at Scale	Jun 20, 2023	3D Generation3D Shape Generation	—Unverified
In-Distribution Consistency Regularization Improves the Generalization of Quantization-Aware Training	Feb 21, 2024	Knowledge DistillationQuantization	—Unverified
PVGNet: A Bottom-Up One-Stage 3D Object Detector With Integrated Multi-Level Features	Jun 19, 2021	3D Object DetectionObject	—Unverified
PHPQ: Pyramid Hybrid Pooling Quantization for Efficient Fine-Grained Image Retrieval	Sep 11, 2021	Deep HashingImage Retrieval	—Unverified
Pyramid Vector Quantization and Bit Level Sparsity in Weights for Efficient Neural Networks Inference	Nov 24, 2019	Quantization	—Unverified
Pyramid Vector Quantization for Deep Learning	Apr 10, 2017	Deep LearningQuantization	—Unverified
Pyramid Vector Quantization for LLMs	Oct 22, 2024	Quantization	—Unverified
QADAM: Quantization-Aware DNN Accelerator Modeling for Pareto-Optimality	May 20, 2022	Quantization	—Unverified
QAPPA: Quantization-Aware Power, Performance, and Area Modeling of DNN Accelerators	May 17, 2022	Model CompressionQuantization	—Unverified
Q-BERT: Hessian Based Ultra Low Precision Quantization of BERT	Sep 12, 2019	Linguistic AcceptabilityNatural Language Inference	—Unverified
qBitcoin: A Peer-to-Peer Quantum Cash System	Nov 19, 2017	Quantization	—Unverified
QBitOpt: Fast and Accurate Bitwidth Reallocation during Training	Jul 10, 2023	Quantization	—Unverified
Q-CapsNets: A Specialized Framework for Quantizing Capsule Networks	Apr 15, 2020	image-classificationImage Classification	—Unverified
QC-ODKLA: Quantized and Communication-Censored Online Decentralized Kernel Learning via Linearized ADMM	Aug 4, 2022	Quantization	—Unverified
QD-BEV : Quantization-aware View-guided Distillation for Multi-view 3D Object Detection	Aug 21, 2023	3D Object DetectionModel Compression	—Unverified
QDyLoRA: Quantized Dynamic Low-Rank Adaptation for Efficient Large Language Model Tuning	Feb 16, 2024	GPULanguage Modeling	—Unverified
QERA: an Analytical Framework for Quantization Error Reconstruction	Oct 8, 2024	parameter-efficient fine-tuningQuantization	—Unverified
QForce-RL: Quantized FPGA-Optimized Reinforcement Learning Compute Engine	Jun 8, 2025	Decision MakingQuantization	—Unverified
QFT: Post-training quantization via fast joint finetuning of all degrees of freedom	Dec 5, 2022	AllQuantization	—Unverified
QFT: Quantized Full-parameter Tuning of LLMs with Affordable Resources	Oct 11, 2023	GPUparameter-efficient fine-tuning	—Unverified
Q-GADMM: Quantized Group ADMM for Communication Efficient Decentralized Machine Learning	Oct 23, 2019	BIG-bench Machine Learningimage-classification	—Unverified
QGait: Toward Accurate Quantization for Gait Recognition with Binarized Input	May 22, 2024	Gait RecognitionQuantization	—Unverified

Show:10 25 50

← PrevPage 158 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified