Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3801–3850 of 4925 papers

Title	Date	Tasks	Status
Patch-wise Mixed-Precision Quantization of Vision Transformer	May 11, 2023	QuantizationSensitivity	—Unverified
A rescaling-invariant Lipschitz bound based on path-metrics for modern ReLU network parameterizations	May 23, 2024	Generalization BoundsNetwork Pruning	—Unverified
Pathology Image Compression with Pre-trained Autoencoders	Mar 14, 2025	Computational EfficiencyImage Compression	—Unverified
PathVQ: Reforming Computational Pathology Foundation Model for Whole Slide Image Analysis via Vector Quantization	Mar 9, 2025	PrognosisQuantization	—Unverified
PCDVQ: Enhancing Vector Quantization for Large Language Models via Polar Coordinate Decoupling	Jun 5, 2025	ClusteringQuantization	—Unverified
PECAN: A Product-Quantized Content Addressable Memory Network	Aug 13, 2022	Quantization	—Unverified
Perceptual Video Quality Prediction Emphasizing Chroma Distortions	Sep 24, 2020	PredictionQuantization	—Unverified
Performance Analysis of IRS-Assisted Cell-Free Communication	Sep 26, 2021	Quantization	—Unverified
Performance Analysis of Massive MIMO Multi-Way Relay Networks with Low-Resolution ADCs	Sep 19, 2019	Quantization	—Unverified
Performance Guaranteed Network Acceleration via High-Order Residual Quantization	Aug 29, 2017	BinarizationQuantization	—Unverified
Performance of Cell-Free MmWave Massive MIMO Systems with Fronthaul Compression and DAC Quantization	Jan 25, 2021	FairnessQuantization	—Unverified
Performance Optimization for Variable Bitwidth Federated Learning in Wireless Networks	Sep 21, 2022	Federated LearningModel-based Reinforcement Learning	—Unverified
Persistence Codebooks for Topological Data Analysis	Feb 13, 2018	BIG-bench Machine LearningQuantization	—Unverified
Personalized Federated Learning for Cellular VR: Online Learning and Dynamic Caching	Jan 20, 2025	Edge-computingFederated Learning	—Unverified
Per-Tensor Fixed-Point Quantization of the Back-Propagation Algorithm	Dec 31, 2018	Quantization	—Unverified
Phoenix: A Low-Precision Floating-Point Quantization Oriented Architecture for Convolutional Neural Networks	Feb 29, 2020	Quantization	—Unverified
Physics-aware Differentiable Discrete Codesign for Diffractive Optical Neural Networks	Sep 28, 2022	Quantization	—Unverified
Physics of Language Models: Part 3.3, Knowledge Capacity Scaling Laws	Apr 8, 2024	Quantization	—Unverified
Pieces of Eight: 8-bit Neural Machine Translation	Apr 13, 2018	Machine TranslationQuantization	—Unverified
PikeLPN: Mitigating Overlooked Inefficiencies of Low-Precision Neural Networks	Jan 1, 2024	Quantization	—Unverified
Information Entropy Guided Height-aware Histogram for Quantization-friendly Pillar Feature Encoder	May 29, 2024	3D Object DetectionAutonomous Driving	—Unverified
PillarHist: A Quantization-aware Pillar Feature Encoder based on Height-aware Histogram	Jan 1, 2025	3D Object DetectionAutonomous Driving	—Unverified
PIM-QAT: Neural Network Quantization for Processing-In-Memory (PIM) Systems	Sep 18, 2022	Quantization	—Unverified
Pinball Loss Minimization for One-bit Compressive Sensing: Convex Models and Algorithms	May 14, 2015	Compressive SensingQuantization	—Unverified
Pioneering 4-Bit FP Quantization for Diffusion Models: Mixup-Sign Quantization and Timestep-Aware Fine-Tuning	Jan 1, 2025	DenoisingQuantization	—Unverified
PIPE : Parallelized Inference Through Post-Training Quantization Ensembling of Residual Expansions	Nov 27, 2023	Quantization	—Unverified
PIVQGAN: Posture and Identity Disentangled Image-to-Image Translation via Vector Quantization	Sep 29, 2021	DisentanglementImage-to-Image Translation	—Unverified
Pixel Embedding: Fully Quantized Convolutional Neural Network with Differentiable Lookup Table	Jul 23, 2024	Quantization	—Unverified
Pixel precise unsupervised detection of viral particle proliferation in cellular imaging data	Nov 10, 2020	ClassificationGeneral Classification	—Unverified
PKLot-A robust dataset for parking lot classification	Jul 1, 2015	BenchmarkingClassification	—Unverified
Plug-and-Play 1.x-Bit KV Cache Quantization for Video Large Language Models	Mar 20, 2025	Quantization	—Unverified
PoET-BiN: Power Efficient Tiny Binary Neurons	Feb 23, 2020	General Classificationimage-classification	—Unverified
PoGO: A Scalable Proof of Useful Work via Quantized Gradient Descent and Merkle Proofs	Apr 10, 2025	GPUQuantization	—Unverified
Asynchronous Decentralized SGD with Quantized and Local Updates	Oct 27, 2019	BlockingDistributed Optimization	—Unverified
Positional Information is All You Need: A Novel Pipeline for Self-Supervised SVDE from Videos	May 18, 2022	AllDepth Estimation	—Unverified
Poster: Self-Supervised Quantization-Aware Knowledge Distillation	Sep 22, 2023	Knowledge DistillationQuantization	—Unverified
Posthoc Interpretation via Quantization	Mar 22, 2023	Image SegmentationQuantization	—Unverified
Post-Training 4-bit Quantization on Embedding Tables	Nov 5, 2019	QuantizationRecommendation Systems	—Unverified
Post-Training Non-Uniform Quantization for Convolutional Neural Networks	Dec 10, 2024	image-classificationImage Classification	—Unverified
Post-Training Quantization for Cross-Platform Learned Image Compression	Feb 15, 2022	Image CompressionQuantization	—Unverified
Post-Training Quantization for Diffusion Transformer via Hierarchical Timestep Grouping	Mar 10, 2025	DenoisingImage Generation	—Unverified
Post-Training Quantization for Energy Efficient Realization of Deep Neural Networks	Oct 14, 2022	Quantization	—Unverified
Improving Post-Training Quantization on Object Detection with Task Loss-Guided Lp Metric	Apr 19, 2023	Objectobject-detection	—Unverified
Post-Training Quantization for Video Matting	Jun 12, 2025	Image MattingModel Compression	—Unverified
Post-Training Quantization for Vision Transformer	Jun 27, 2021	DiversityQuantization	—Unverified
Post-Training Quantization for Vision Mamba with k-Scaled Quantization and Reparameterization	Jan 28, 2025	MambaQuantization	—Unverified
Post-Training Quantization Is All You Need to Perform Cross-Platform Learned Image Compression	Sep 29, 2021	AllImage Compression	—Unverified
Shedding the Bits: Pushing the Boundaries of Quantization with Minifloats on FPGAs	Nov 21, 2023	Model CompressionQuantization	—Unverified
Post-training Quantization with Multiple Points: Mixed Precision without Mixed Precision	Feb 20, 2020	object-detectionObject Detection	—Unverified
Post-Training Weighted Quantization of Neural Networks for Language Models	Jan 1, 2021	Model CompressionQuantization	—Unverified

Show:10 25 50

← PrevPage 77 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified