Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3801–3825 of 4925 papers

Title	Date	Tasks	Status
Patch-wise Mixed-Precision Quantization of Vision Transformer	May 11, 2023	QuantizationSensitivity	—Unverified
A rescaling-invariant Lipschitz bound based on path-metrics for modern ReLU network parameterizations	May 23, 2024	Generalization BoundsNetwork Pruning	—Unverified
Pathology Image Compression with Pre-trained Autoencoders	Mar 14, 2025	Computational EfficiencyImage Compression	—Unverified
PathVQ: Reforming Computational Pathology Foundation Model for Whole Slide Image Analysis via Vector Quantization	Mar 9, 2025	PrognosisQuantization	—Unverified
PCDVQ: Enhancing Vector Quantization for Large Language Models via Polar Coordinate Decoupling	Jun 5, 2025	ClusteringQuantization	—Unverified
PECAN: A Product-Quantized Content Addressable Memory Network	Aug 13, 2022	Quantization	—Unverified
Perceptual Video Quality Prediction Emphasizing Chroma Distortions	Sep 24, 2020	PredictionQuantization	—Unverified
Performance Analysis of IRS-Assisted Cell-Free Communication	Sep 26, 2021	Quantization	—Unverified
Performance Analysis of Massive MIMO Multi-Way Relay Networks with Low-Resolution ADCs	Sep 19, 2019	Quantization	—Unverified
Performance Guaranteed Network Acceleration via High-Order Residual Quantization	Aug 29, 2017	BinarizationQuantization	—Unverified
Performance of Cell-Free MmWave Massive MIMO Systems with Fronthaul Compression and DAC Quantization	Jan 25, 2021	FairnessQuantization	—Unverified
Performance Optimization for Variable Bitwidth Federated Learning in Wireless Networks	Sep 21, 2022	Federated LearningModel-based Reinforcement Learning	—Unverified
Persistence Codebooks for Topological Data Analysis	Feb 13, 2018	BIG-bench Machine LearningQuantization	—Unverified
Personalized Federated Learning for Cellular VR: Online Learning and Dynamic Caching	Jan 20, 2025	Edge-computingFederated Learning	—Unverified
Per-Tensor Fixed-Point Quantization of the Back-Propagation Algorithm	Dec 31, 2018	Quantization	—Unverified
Phoenix: A Low-Precision Floating-Point Quantization Oriented Architecture for Convolutional Neural Networks	Feb 29, 2020	Quantization	—Unverified
Physics-aware Differentiable Discrete Codesign for Diffractive Optical Neural Networks	Sep 28, 2022	Quantization	—Unverified
Physics of Language Models: Part 3.3, Knowledge Capacity Scaling Laws	Apr 8, 2024	Quantization	—Unverified
Pieces of Eight: 8-bit Neural Machine Translation	Apr 13, 2018	Machine TranslationQuantization	—Unverified
PikeLPN: Mitigating Overlooked Inefficiencies of Low-Precision Neural Networks	Jan 1, 2024	Quantization	—Unverified
Information Entropy Guided Height-aware Histogram for Quantization-friendly Pillar Feature Encoder	May 29, 2024	3D Object DetectionAutonomous Driving	—Unverified
PillarHist: A Quantization-aware Pillar Feature Encoder based on Height-aware Histogram	Jan 1, 2025	3D Object DetectionAutonomous Driving	—Unverified
PIM-QAT: Neural Network Quantization for Processing-In-Memory (PIM) Systems	Sep 18, 2022	Quantization	—Unverified
Pinball Loss Minimization for One-bit Compressive Sensing: Convex Models and Algorithms	May 14, 2015	Compressive SensingQuantization	—Unverified
Pioneering 4-Bit FP Quantization for Diffusion Models: Mixup-Sign Quantization and Timestep-Aware Fine-Tuning	Jan 1, 2025	DenoisingQuantization	—Unverified

Show:10 25 50

← PrevPage 153 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified