Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1801–1850 of 4925 papers

Title	Date	Tasks	Status
Composite Code Sparse Autoencoders for first stage retrieval	Apr 14, 2022	Image RetrievalInformation Retrieval	—Unverified
Are Words the Quanta of Human Language? Extending the Domain of Quantum Cognition	Oct 10, 2021	Cultural Vocal Bursts Intensity PredictionInformation Retrieval	—Unverified
Federated Learning With Quantized Global Model Updates	Jun 18, 2020	Federated Learningmodel	—Unverified
Finetuning and Quantization of EEG-Based Foundational BioSignal Models on ECG and PPG Data for Blood Pressure Estimation	Feb 10, 2025	Blood pressure estimationEEG	—Unverified
Federated Learning with Lossy Distributed Source Coding: Analysis and Optimization	Apr 23, 2022	Federated LearningQuantization	—Unverified
FinGPT-HPC: Efficient Pretraining and Finetuning Large Language Models for Financial Applications with High-Performance Computing	Feb 21, 2024	GPUModel Compression	—Unverified
Component Training of Turbo Autoencoders	May 16, 2023	Quantization	—Unverified
RATQ: A Universal Fixed-Length Quantizer for Stochastic Optimization	Aug 22, 2019	QuantizationStochastic Optimization	—Unverified
Federated Learning: Strategies for Improving Communication Efficiency	Oct 18, 2016	Federated LearningQuantization	—Unverified
CompMarkGS: Robust Watermarking for Compressed 3D Gaussian Splatting	Mar 17, 2025	3DGS3D Reconstruction	—Unverified
A Diffusion Model Based Quality Enhancement Method for HEVC Compressed Video	Nov 15, 2023	DecoderQuantization	—Unverified
Federated Learning in Adversarial Settings	Oct 15, 2020	Federated LearningQuantization	—Unverified
Completion Time Minimization of Fog-RAN-Assisted Federated Learning With Rate-Splitting Transmission	Jun 3, 2022	Federated LearningQuantization	—Unverified
FIXAR: A Fixed-Point Deep Reinforcement Learning Platform with Quantization-Aware Training and Adaptive Parallelism	Feb 24, 2021	CPUDeep Reinforcement Learning	—Unverified
Federated Aggregation of Mallows Rankings: A Comparative Analysis of Borda and Lehmer Coding	Sep 1, 2024	Privacy PreservingQuantization	—Unverified
Fixed-point optimization of deep neural networks with adaptive step size retraining	Feb 27, 2017	Quantization	—Unverified
Compensate Quantization Errors+: Quantized Models Are Inquisitive Learners	Jul 22, 2024	Lightweight DeploymentQuantization	—Unverified
Fixed-point quantization aware training for on-device keyword-spotting	Mar 4, 2023	Keyword SpottingQuantization	—Unverified
A Review of Recent Advances of Binary Neural Networks for Edge Computing	Nov 24, 2020	Edge-computingNeural Architecture Search	—Unverified
Fixed Point Quantization of Deep Convolutional Networks	Nov 19, 2015	Quantization	—Unverified
Fixflow: A Framework to Evaluate Fixed-point Arithmetic in Light-Weight CNN Inference	Feb 19, 2023	ClassificationQuantization	—Unverified
FLARE: FP-Less PTQ and Low-ENOB ADC Based AMS-PiM for Error-Resilient, Fast, and Efficient Transformer Acceleration	Nov 22, 2024	Quantization	—Unverified
FedDQ: Communication-Efficient Federated Learning with Descending Quantization	Oct 5, 2021	Federated LearningModel Compression	—Unverified
FlashAttention on a Napkin: A Diagrammatic Approach to Deep Learning IO-Awareness	Dec 4, 2024	GPUQuantization	—Unverified
FedDM: Enhancing Communication Efficiency and Handling Data Heterogeneity in Federated Diffusion Models	Jul 20, 2024	Quantization	—Unverified
FlatENN: Train Flat for Enhanced Fault Tolerance of Quantized Deep Neural Networks	Dec 29, 2022	Model CompressionQuantization	—Unverified
FedDiSC: A Computation-efficient Federated Learning Framework for Power Systems Disturbance and Cyber Attack Discrimination	Apr 7, 2023	Federated LearningPrivacy Preserving	—Unverified
Flattened one-bit stochastic gradient descent: compressed distributed optimization with controlled variance	May 17, 2024	Distributed OptimizationQuantization	—Unverified
Fed-CVLC: Compressing Federated Learning Communications with Variable-Length Codes	Feb 6, 2024	Federated LearningModel Compression	—Unverified
Compensate Quantization Errors: Make Weights Hierarchical to Compensate Each Other	Jun 24, 2024	Quantization	—Unverified
A review of learning vector quantization classifiers	Sep 23, 2015	Quantization	—Unverified
A Different View of Sigma-Delta Modulators Under the Lens of Pulse Frequency Modulation	Nov 12, 2023	Quantization	—Unverified
Flexible Unsupervised Learning for Massive MIMO Subarray Hybrid Beamforming	Aug 10, 2022	Quantization	—Unverified
FleXOR: Trainable Fractional Quantization	Sep 9, 2020	Quantization	—Unverified
3DQ: Compact Quantized Neural Networks for Volumetric Whole Brain Segmentation	Apr 5, 2019	Brain SegmentationModel Compression	—Unverified
FedComLoc: Communication-Efficient Distributed Training of Sparse and Quantized Models	Mar 14, 2024	Federated LearningQuantization	—Unverified
FlightLLM: Efficient Large Language Model Inference with a Complete Mapping Flow on FPGAs	Jan 8, 2024	Computational EfficiencyGPU	—Unverified
FLightNNs: Lightweight Quantized Deep Neural Networks for Fast and Accurate Inference	Apr 5, 2019	Quantization	—Unverified
FedAQ: Communication-Efficient Federated Edge Learning via Joint Uplink and Downlink Adaptive Quantization	Jun 26, 2024	Federated LearningQuantization	—Unverified
Comparison of 14 different families of classification algorithms on 115 binary datasets	Jun 2, 2016	General ClassificationQuantization	—Unverified
Feature Quantization for Defending Against Distortion of Images	Jun 1, 2018	Quantization	—Unverified
FlowPrecision: Advancing FPGA-Based Real-Time Fluid Flow Estimation with Linear Quantization	Mar 4, 2024	Quantization	—Unverified
Comparing Iterative and Least-Squares Based Phase Noise Tracking in Receivers with 1-bit Quantization and Oversampling	Sep 12, 2023	Quantization	—Unverified
FlowVQTalker: High-Quality Emotional Talking Face Generation through Normalizing Flow and Quantization	Mar 11, 2024	Face GenerationQuantization	—Unverified
High-performance deep spiking neural networks with 0.3 spikes per neuron	Jun 14, 2023	image-classificationImage Classification	—Unverified
FoldToken2: Learning compact, invariant and generative protein structure language	Jun 11, 2024	DecoderQuantization	—Unverified
Comparing Fisher Information Regularization with Distillation for DNN Quantization	Oct 19, 2020	Knowledge DistillationQuantization	—Unverified
Foothill: A Quasiconvex Regularization for Edge Computing of Deep Neural Networks	Jan 18, 2019	Edge-computingGeneral Classification	—Unverified
Forearm Ultrasound based Gesture Recognition on Edge	Sep 16, 2024	Gesture RecognitionHand Gesture Recognition	—Unverified
Feature Affinity Assisted Knowledge Distillation and Quantization of Deep Neural Networks on Label-Free Data	Feb 10, 2023	Knowledge DistillationQuantization	—Unverified

Show:10 25 50

← PrevPage 37 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified