Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4551–4600 of 4925 papers

Title	Date	Tasks	Status
FastQuery: Communication-efficient Embedding Table Query for Private LLM Inference	May 25, 2024	Quantization	—Unverified
FastSGD: A Fast Compressed SGD Framework for Distributed Machine Learning	Dec 8, 2021	BIG-bench Machine LearningQuantization	—Unverified
Fast Template Evaluation with Vector Quantization	Dec 1, 2013	object-detectionObject Detection	—Unverified
Fast top-K Cosine Similarity Search through XOR-Friendly Binary Quantization on GPUs	Aug 5, 2020	GPUQuantization	—Unverified
FAT: An In-Memory Accelerator with Fast Addition for Ternary Weight Neural Networks	Jan 19, 2022	Quantization	—Unverified
FATNN: Fast and Accurate Ternary Neural Networks	Aug 12, 2020	image-classificationImage Classification	—Unverified
Fault-Tolerant Four-Dimensional Constellation for Coherent Optical Transmission Systems	Nov 29, 2023	Quantization	—Unverified
FBI: Fingerprinting models with Benign Inputs	Aug 5, 2022	Quantization	—Unverified
FBQuant: FeedBack Quantization for Large Language Models	Jan 25, 2025	Quantization	—Unverified
FCN-Pose: A Pruned and Quantized CNN for Robot Pose Estimation for Constrained Devices	May 26, 2022	Pose EstimationQuantization	—Unverified
FD Cell-Free mMIMO: Analysis and Optimization	Oct 27, 2020	Quantization	—Unverified
FDD Massive MIMO: How to Optimally Combine UL Pilot and Limited DL CSI Feedback?	May 14, 2024	Quantization	—Unverified
FD-LSCIC: Frequency Decomposition-based Learned Screen Content Image Compression	Feb 21, 2025	Image CompressionMS-SSIM	—Unverified
Feature Affinity Assisted Knowledge Distillation and Quantization of Deep Neural Networks on Label-Free Data	Feb 10, 2023	Knowledge DistillationQuantization	—Unverified
Feature Quantization for Defending Against Distortion of Images	Jun 1, 2018	Quantization	—Unverified
FedAQ: Communication-Efficient Federated Edge Learning via Joint Uplink and Downlink Adaptive Quantization	Jun 26, 2024	Federated LearningQuantization	—Unverified
FedComLoc: Communication-Efficient Distributed Training of Sparse and Quantized Models	Mar 14, 2024	Federated LearningQuantization	—Unverified
Fed-CVLC: Compressing Federated Learning Communications with Variable-Length Codes	Feb 6, 2024	Federated LearningModel Compression	—Unverified
FedDiSC: A Computation-efficient Federated Learning Framework for Power Systems Disturbance and Cyber Attack Discrimination	Apr 7, 2023	Federated LearningPrivacy Preserving	—Unverified
FedDM: Enhancing Communication Efficiency and Handling Data Heterogeneity in Federated Diffusion Models	Jul 20, 2024	Quantization	—Unverified
FedDQ: Communication-Efficient Federated Learning with Descending Quantization	Oct 5, 2021	Federated LearningModel Compression	—Unverified
Federated Aggregation of Mallows Rankings: A Comparative Analysis of Borda and Lehmer Coding	Sep 1, 2024	Privacy PreservingQuantization	—Unverified
Federated Learning in Adversarial Settings	Oct 15, 2020	Federated LearningQuantization	—Unverified
Federated Learning: Strategies for Improving Communication Efficiency	Oct 18, 2016	Federated LearningQuantization	—Unverified
Federated Learning with Lossy Distributed Source Coding: Analysis and Optimization	Apr 23, 2022	Federated LearningQuantization	—Unverified
Federated Learning With Quantized Global Model Updates	Jun 18, 2020	Federated Learningmodel	—Unverified
HAFLQ: Heterogeneous Adaptive Federated LoRA Fine-tuned LLM with Quantization	Nov 10, 2024	Quantizationtext-classification	—Unverified
Federated Split BERT for Heterogeneous Text Classification	May 26, 2022	ClassificationFederated Learning	—Unverified
Federated Split Learning with Model Pruning and Gradient Quantization in Wireless Networks	Dec 9, 2024	Federated LearningQuantization	—Unverified
Federated TD Learning over Finite-Rate Erasure Channels: Linear Speedup under Markovian Sampling	May 14, 2023	Distributed OptimizationFederated Learning	—Unverified
FedHQ: Hybrid Runtime Quantization for Federated Learning	May 17, 2025	Federated LearningQuantization	—Unverified
FedMPQ: Secure and Communication-Efficient Federated Learning with Multi-codebook Product Quantization	Apr 21, 2024	Federated LearningQuantization	—Unverified
FedPAQ: A Communication-Efficient Federated Learning Method with Periodic Averaging and Quantization	Sep 28, 2019	Federated LearningQuantization	—Unverified
FedShift: Tackling Dual Heterogeneity Problem of Federated Learning via Weight Shift Aggregation	Feb 2, 2024	DiversityFederated Learning	—Unverified
FedX: Adaptive Model Decomposition and Quantization for IoT Federated Learning	Apr 17, 2025	Federated LearningQuantization	—Unverified
FETCH: A Memory-Efficient Replay Approach for Continual Learning in Image Classification	Jul 17, 2024	BenchmarkingContinual Learning	—Unverified
Few-bit Quantization of Neural Networks for Nonlinearity Mitigation in a Fiber Transmission Experiment	May 23, 2022	Quantization	—Unverified
FewGAN: Generating from the Joint Distribution of a Few Images	Jul 18, 2022	Quantization	—Unverified
FFN Fusion: Rethinking Sequential Computation in Large Language Models	Mar 24, 2025	Quantization	—Unverified
FGMP: Fine-Grained Mixed-Precision Weight and Activation Quantization for Hardware-Accelerated LLM Inference	Apr 19, 2025	Large Language ModelQuantization	—Unverified
Fighting over-fitting with quantization for learning deep neural networks on noisy labels	Mar 21, 2023	Action Unit DetectionFacial Action Unit Detection	—Unverified
Fighting Quantization Bias With Bias	Jun 7, 2019	Quantization	—Unverified
Filter Pre-Pruning for Improved Fine-tuning of Quantized Deep Neural Networks	Nov 13, 2020	Quantization	—Unverified
FineQ: Software-Hardware Co-Design for Low-Bit Fine-Grained Mixed-Precision Quantization of LLMs	Apr 28, 2025	Quantization	—Unverified
FineQuant: Unlocking Efficiency with Fine-Grained Weight-Only Quantization for LLMs	Aug 16, 2023	GPUMixture-of-Experts	—Unverified
Finetuning and Quantization of EEG-Based Foundational BioSignal Models on ECG and PPG Data for Blood Pressure Estimation	Feb 10, 2025	Blood pressure estimationEEG	—Unverified
FinGPT-HPC: Efficient Pretraining and Finetuning Large Language Models for Financial Applications with High-Performance Computing	Feb 21, 2024	GPUModel Compression	—Unverified
Finite-Bit Quantization For Distributed Algorithms With Linear Convergence	Jul 23, 2021	Quantization	—Unverified
RATQ: A Universal Fixed-Length Quantizer for Stochastic Optimization	Aug 22, 2019	QuantizationStochastic Optimization	—Unverified
FinLoRA: Finetuning Quantized Financial Large Language Models Using Low-Rank Adaptation	Dec 16, 2024	GPUInformation Retrieval	—Unverified

Show:10 25 50

← PrevPage 92 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified