Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3401–3425 of 4925 papers

Title	Date	Tasks	Status
A 14uJ/Decision Keyword Spotting Accelerator with In-SRAM-Computing and On Chip Learning for Customization	May 10, 2022	Keyword SpottingQuantization	—Unverified
A^2ATS: Retrieval-Based KV Cache Reduction via Windowed Rotary Position Embedding and Query-Aware Vector Quantization	Feb 18, 2025	CPUPosition	—Unverified
A 2-bit Wideband 5G mm-Wave RIS with Low Side Lobe Levels and no Quantization Lobe	Feb 22, 2025	Quantization	—Unverified
A3 : an Analytical Low-Rank Approximation Framework for Attention	May 19, 2025	Quantization	—Unverified
A 58.6mW Real-Time Programmable Object Detector with Multi-Scale Multi-Object Support Using Deformable Parts Model on 1920x1080 Video at 30fps	Jul 27, 2016	ClassificationGeneral Classification	—Unverified
DeltaKWS: A 65nm 36nJ/Decision Bio-inspired Temporal-Sparsity-Aware Digital Keyword Spotting IC with 0.6V Near-Threshold SRAM	May 6, 2024	channel selectionKeyword Spotting	—Unverified
A 65nm 8b-Activation 8b-Weight SRAM-Based Charge-Domain Computing-in-Memory Macro Using A Fully-Parallel Analog Adder Network and A Single-ADC Interface	Nov 23, 2022	Quantization	—Unverified
A 71.2-μW Speech Recognition Accelerator with Recurrent Spiking Neural Network	Mar 27, 2025	Quantizationspeech-recognition	—Unverified
A Bag of Tricks for Scaling CPU-based Deep FFMs to more than 300m Predictions per Second	Jul 14, 2024	Click-Through Rate PredictionCPU	—Unverified
A binary-activation, multi-level weight RNN and training algorithm for ADC-/DAC-free and noise-resilient processing-in-memory inference with eNVM	Nov 30, 2019	Quantization	—Unverified
Ab-initio quantum chemistry with neural-network wavefunctions	Aug 26, 2022	Quantizationscientific discovery	—Unverified
A Biresolution Spectral Framework for Product Quantization	Jun 1, 2018	Quantization	—Unverified
A blob method for inhomogeneous diffusion with applications to multi-agent control and sampling	Feb 25, 2022	Quantization	—Unverified
A Blockchain Solution for Collaborative Machine Learning over IoT	Nov 23, 2023	Federated LearningIncremental Learning	—Unverified
Single-path Bit Sharing for Automatic Loss-aware Model Compression	Jan 13, 2021	Model CompressionNetwork Pruning	—Unverified
Abstractive summarization from Audio Transcription	Jul 30, 2024	Abstractive Text SummarizationQuantization	—Unverified
A Carbon Tracking Model for Federated Learning: Impact of Quantization and Sparsification	Oct 12, 2023	Federated LearningQuantization	—Unverified
Accelerated AI Inference via Dynamic Execution Methods	Oct 30, 2024	Quantization	—Unverified
Accelerated Distance Computation with Encoding Tree for High Dimensional Data	Sep 17, 2015	QuantizationVocal Bursts Intensity Prediction	—Unverified
Accelerating Deep Learning Inference via Freezing	Feb 7, 2020	Deep LearningQuantization	—Unverified
Accelerating Deep Learning Model Inference on Arm CPUs with Ultra-Low Bit Quantization and Runtime	Jul 18, 2022	Quantization	—Unverified
Accelerating Deep Learning with Dynamic Data Pruning	Nov 24, 2021	AttributeDeep Learning	—Unverified
Accelerating Energy-Efficient Federated Learning in Cell-Free Networks with Adaptive Quantization	Dec 30, 2024	Federated LearningQuantization	—Unverified
Accelerating Inference and Language Model Fusion of Recurrent Neural Network Transducers via End-to-End 4-bit Quantization	Jun 16, 2022	Language ModelingLanguage Modelling	—Unverified
Accelerating Neural Network Inference by Overflow Aware Quantization	May 27, 2020	image-classificationImage Classification	—Unverified

Show:10 25 50

← PrevPage 137 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified