Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1851–1900 of 4925 papers

Title	Date	Tasks	Status
A Different View of Sigma-Delta Modulators Under the Lens of Pulse Frequency Modulation	Nov 12, 2023	Quantization	—Unverified
Reinforcement Learning with Foundation Priors: Let the Embodied Agent Efficiently Learn on Its Own	Oct 4, 2023	Quantizationreinforcement-learning	—Unverified
3DQ: Compact Quantized Neural Networks for Volumetric Whole Brain Segmentation	Apr 5, 2019	Brain SegmentationModel Compression	—Unverified
FoVolNet: Fast Volume Rendering using Foveated Deep Neural Networks	Sep 20, 2022	Data VisualizationImage Reconstruction	—Unverified
FedComLoc: Communication-Efficient Distributed Training of Sparse and Quantized Models	Mar 14, 2024	Federated LearningQuantization	—Unverified
FedAQ: Communication-Efficient Federated Edge Learning via Joint Uplink and Downlink Adaptive Quantization	Jun 26, 2024	Federated LearningQuantization	—Unverified
Comparison of 14 different families of classification algorithms on 115 binary datasets	Jun 2, 2016	General ClassificationQuantization	—Unverified
Feature Quantization for Defending Against Distortion of Images	Jun 1, 2018	Quantization	—Unverified
FP8-BERT: Post-Training Quantization for Transformer	Dec 10, 2023	Quantization	—Unverified
Comparing Iterative and Least-Squares Based Phase Noise Tracking in Receivers with 1-bit Quantization and Oversampling	Sep 12, 2023	Quantization	—Unverified
High-performance deep spiking neural networks with 0.3 spikes per neuron	Jun 14, 2023	image-classificationImage Classification	—Unverified
FP8 versus INT8 for efficient deep learning inference	Mar 31, 2023	Deep LearningQuantization	—Unverified
Comparing Fisher Information Regularization with Distillation for DNN Quantization	Oct 19, 2020	Knowledge DistillationQuantization	—Unverified
FPGA Resource-aware Structured Pruning for Real-Time Neural Networks	Aug 9, 2023	Classificationimage-classification	—Unverified
Feature Affinity Assisted Knowledge Distillation and Quantization of Deep Neural Networks on Label-Free Data	Feb 10, 2023	Knowledge DistillationQuantization	—Unverified
Compact Token Representations with Contextual Quantization for Efficient Document Re-ranking	Mar 29, 2022	QuantizationRe-Ranking	—Unverified
FPSAttention: Training-Aware FP8 and Sparsity Co-Design for Fast Video Diffusion	Jun 5, 2025	DenoisingQuantization	—Unverified
FPTQ: Fine-grained Post-Training Quantization for Large Language Models	Aug 30, 2023	Quantization	—Unverified
FPTQuant: Function-Preserving Transforms for LLM Quantization	Jun 5, 2025	Quantization	—Unverified
FP=xINT:A Low-Bit Series Expansion Algorithm for Post-Training Quantization	Dec 9, 2024	Quantization	—Unverified
ADFQ-ViT: Activation-Distribution-Friendly Post-Training Quantization for Vision Transformers	Jul 3, 2024	Attributeimage-classification	—Unverified
FD-LSCIC: Frequency Decomposition-based Learned Screen Content Image Compression	Feb 21, 2025	Image CompressionMS-SSIM	—Unverified
FDD Massive MIMO: How to Optimally Combine UL Pilot and Limited DL CSI Feedback?	May 14, 2024	Quantization	—Unverified
FD Cell-Free mMIMO: Analysis and Optimization	Oct 27, 2020	Quantization	—Unverified
Compact Token Representations with Contextual Quantization for Efficient Document Re-ranking	Nov 16, 2021	QuantizationRe-Ranking	—Unverified
FCN-Pose: A Pruned and Quantized CNN for Robot Pose Estimation for Constrained Devices	May 26, 2022	Pose EstimationQuantization	—Unverified
Frame Quantization of Neural Networks	Apr 11, 2024	Quantization	—Unverified
Free Bits: Latency Optimization of Mixed-Precision Quantized Neural Networks on the Edge	Jul 6, 2023	NavigateQuantization	—Unverified
FBQuant: FeedBack Quantization for Large Language Models	Jan 25, 2025	Quantization	—Unverified
Frequency Autoregressive Image Generation with Continuous Tokens	Mar 7, 2025	Image GenerationLanguage Modeling	—Unverified
Frequency-Biased Synergistic Design for Image Compression and Compensation	Jan 1, 2025	Image CompressionQuantization	—Unverified
Frequency Disentangled Features in Neural Image Compression	Aug 4, 2023	DisentanglementImage Compression	—Unverified
Compact Representation for Image Classification: To Choose or to Compress?	Jun 1, 2014	ClassificationCPU	—Unverified
From Algorithm to Hardware: A Survey on Efficient and Safe Deployment of Deep Neural Networks	May 9, 2024	Knowledge DistillationModel Compression	—Unverified
FBI: Fingerprinting models with Benign Inputs	Aug 5, 2022	Quantization	—Unverified
Compact recurrent neural networks for acoustic event detection on low-energy low-complexity platforms	Jan 29, 2020	Event DetectionQuantization	—Unverified
Are disentangled representations all you need to build speaker anonymization systems?	Aug 22, 2022	AllAutomatic Speech Recognition	—Unverified
From Large to Super-Tiny: End-to-End Optimization for Cost-Efficient LLMs	Apr 18, 2025	Knowledge DistillationModel Compression	—Unverified
From Text to Source: Results in Detecting Large Language Model-Generated Content	Sep 23, 2023	AttributeLanguage Modeling	—Unverified
A Deep Learning Inference Scheme Based on Pipelined Matrix Multiplication Acceleration Design and Non-uniform Quantization	Oct 10, 2021	Edge-computingQ-Learning	—Unverified
Fronthaul Compression and Passive Beamforming Design for Intelligent Reflecting Surface-aided Cloud Radio Access Networks	Feb 25, 2021	Quantization	—Unverified
Fronthaul-Constrained Distributed Radar Sensing	Sep 26, 2024	Quantization	—Unverified
Fronthaul Quantization-Aware MU-MIMO Precoding for Sum Rate Maximization	Jun 27, 2024	Quantization	—Unverified
FSNet: Compression of Deep Convolutional Neural Networks by Filter Summary	Feb 8, 2019	General Classificationimage-classification	—Unverified
Accelerator-Aware Training for Transducer-Based Speech Recognition	May 12, 2023	CPUQuantization	—Unverified
FTL: A universal framework for training low-bit DNNs via Feature Transfer	Aug 1, 2020	QuantizationTransfer Learning	—Unverified
Fault-Tolerant Four-Dimensional Constellation for Coherent Optical Transmission Systems	Nov 29, 2023	Quantization	—Unverified
Compact Neural Graphics Primitives with Learned Hash Probing	Dec 28, 2023	Quantization	—Unverified
FATNN: Fast and Accurate Ternary Neural Networks	Aug 12, 2020	image-classificationImage Classification	—Unverified
CompactifAI: Extreme Compression of Large Language Models using Quantum-Inspired Tensor Networks	Jan 25, 2024	Model CompressionQuantization	—Unverified

Show:10 25 50

← PrevPage 38 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified