Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4526–4550 of 4925 papers

Title	Date	Tasks	Status
Factorized Visual Tokenization and Generation	Nov 25, 2024	DisentanglementImage Generation	—Unverified
FactorizeNet: Progressive Depth Factorization for Efficient Network Architecture Exploration Under Quantization Constraints	Nov 30, 2020	Quantization	—Unverified
False Detection (Positives and Negatives) in Object Detection	Aug 16, 2020	Objectobject-detection	—Unverified
FAMES: Fast Approximate Multiplier Substitution for Mixed-Precision Quantized DNNs--Down to 2 Bits!	Nov 27, 2024	Quantization	—Unverified
FantastIC4: A Hardware-Software Co-Design Approach for Efficiently Running 4bit-Compact Multilayer Perceptrons	Dec 17, 2020	Quantization	—Unverified
FAQ: Mitigating the Impact of Faults in the Weight Memory of DNN Accelerators through Fault-Aware Quantization	May 21, 2023	Quantization	—Unverified
FAQS: Communication-efficient Federate DNN Architecture and Quantization Co-Search for personalized Hardware-aware Preferences	Oct 16, 2022	Neural Architecture SearchQuantization	—Unverified
Fast Autoregressive Models for Continuous Latent Generation	Apr 24, 2025	DenoisingImage Generation	—Unverified
Fast binary embeddings, and quantized compressed sensing with structured matrices	Jan 26, 2018	compressed sensingQuantization	—Unverified
Fast, Compact, and High Quality LSTM-RNN Based Statistical Parametric Speech Synthesizers for Mobile Devices	Jun 20, 2016	QuantizationSpeech Synthesis	—Unverified
Fast DistilBERT on CPUs	Oct 27, 2022	Knowledge DistillationModel Compression	—Unverified
FAST: DNN Training Under Variable Precision Block Floating Point with Stochastic Rounding	Oct 28, 2021	Quantization	—Unverified
Fastening the Initial Access in 5G NR Sidelink for 6G V2X Networks	Jun 10, 2021	PositionQuantization	—Unverified
Faster Inference of Integer SWIN Transformer by Removing the GELU Activation	Feb 2, 2024	GPUimage-classification	—Unverified
Faster Neural Net Inference via Forests of Sparse Oblique Decision Trees	Sep 29, 2021	Quantization	—Unverified
FastICARL: Fast Incremental Classifier and Representation Learning with Efficient Budget Allocation in Audio Sensing Applications	Jun 14, 2021	Incremental LearningQuantization	—Unverified
Fast Implementation of 4-bit Convolutional Neural Networks for Mobile Devices	Sep 14, 2020	Optical Character Recognition (OCR)Quantization	—Unverified
Fast Inference of Tree Ensembles on ARM Devices	May 15, 2023	Quantization	—Unverified
Fast Jet Tagging with MLP-Mixers on FPGAs	Mar 5, 2025	Jet TaggingQuantization	—Unverified
Fast Large-Scale Discrete Optimization Based on Principal Coordinate Descent	Sep 16, 2019	Quantization	—Unverified
Fast learning rates with heavy-tailed losses	Sep 29, 2016	ClusteringQuantization	—Unverified
Fast Low-rank Representation based Spatial Pyramid Matching for Image Classification	Sep 22, 2014	General Classificationimage-classification	—Unverified
FastMamba: A High-Speed and Efficient Mamba Accelerator on FPGA with Accurate Quantization	May 25, 2025	Computational EfficiencyCPU	—Unverified
Fast on-line signature recognition based on VQ with time modeling	Mar 23, 2022	Quantization	—Unverified
Fast Orthogonal Projection Based on Kronecker Product	Dec 1, 2015	Image RetrievalQuantization	—Unverified

Show:10 25 50

← PrevPage 182 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified