Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3401–3450 of 4925 papers

Title	Date	Tasks	Status
A 14uJ/Decision Keyword Spotting Accelerator with In-SRAM-Computing and On Chip Learning for Customization	May 10, 2022	Keyword SpottingQuantization	—Unverified
A^2ATS: Retrieval-Based KV Cache Reduction via Windowed Rotary Position Embedding and Query-Aware Vector Quantization	Feb 18, 2025	CPUPosition	—Unverified
A 2-bit Wideband 5G mm-Wave RIS with Low Side Lobe Levels and no Quantization Lobe	Feb 22, 2025	Quantization	—Unverified
A3 : an Analytical Low-Rank Approximation Framework for Attention	May 19, 2025	Quantization	—Unverified
A 58.6mW Real-Time Programmable Object Detector with Multi-Scale Multi-Object Support Using Deformable Parts Model on 1920x1080 Video at 30fps	Jul 27, 2016	ClassificationGeneral Classification	—Unverified
DeltaKWS: A 65nm 36nJ/Decision Bio-inspired Temporal-Sparsity-Aware Digital Keyword Spotting IC with 0.6V Near-Threshold SRAM	May 6, 2024	channel selectionKeyword Spotting	—Unverified
A 65nm 8b-Activation 8b-Weight SRAM-Based Charge-Domain Computing-in-Memory Macro Using A Fully-Parallel Analog Adder Network and A Single-ADC Interface	Nov 23, 2022	Quantization	—Unverified
A 71.2-μW Speech Recognition Accelerator with Recurrent Spiking Neural Network	Mar 27, 2025	Quantizationspeech-recognition	—Unverified
A Bag of Tricks for Scaling CPU-based Deep FFMs to more than 300m Predictions per Second	Jul 14, 2024	Click-Through Rate PredictionCPU	—Unverified
A binary-activation, multi-level weight RNN and training algorithm for ADC-/DAC-free and noise-resilient processing-in-memory inference with eNVM	Nov 30, 2019	Quantization	—Unverified
Ab-initio quantum chemistry with neural-network wavefunctions	Aug 26, 2022	Quantizationscientific discovery	—Unverified
A Biresolution Spectral Framework for Product Quantization	Jun 1, 2018	Quantization	—Unverified
A blob method for inhomogeneous diffusion with applications to multi-agent control and sampling	Feb 25, 2022	Quantization	—Unverified
A Blockchain Solution for Collaborative Machine Learning over IoT	Nov 23, 2023	Federated LearningIncremental Learning	—Unverified
Single-path Bit Sharing for Automatic Loss-aware Model Compression	Jan 13, 2021	Model CompressionNetwork Pruning	—Unverified
Abstractive summarization from Audio Transcription	Jul 30, 2024	Abstractive Text SummarizationQuantization	—Unverified
A Carbon Tracking Model for Federated Learning: Impact of Quantization and Sparsification	Oct 12, 2023	Federated LearningQuantization	—Unverified
Accelerated AI Inference via Dynamic Execution Methods	Oct 30, 2024	Quantization	—Unverified
Accelerated Distance Computation with Encoding Tree for High Dimensional Data	Sep 17, 2015	QuantizationVocal Bursts Intensity Prediction	—Unverified
Accelerating Deep Learning Inference via Freezing	Feb 7, 2020	Deep LearningQuantization	—Unverified
Accelerating Deep Learning Model Inference on Arm CPUs with Ultra-Low Bit Quantization and Runtime	Jul 18, 2022	Quantization	—Unverified
Accelerating Deep Learning with Dynamic Data Pruning	Nov 24, 2021	AttributeDeep Learning	—Unverified
Accelerating Energy-Efficient Federated Learning in Cell-Free Networks with Adaptive Quantization	Dec 30, 2024	Federated LearningQuantization	—Unverified
Accelerating Inference and Language Model Fusion of Recurrent Neural Network Transducers via End-to-End 4-bit Quantization	Jun 16, 2022	Language ModelingLanguage Modelling	—Unverified
Accelerating Neural Network Inference by Overflow Aware Quantization	May 27, 2020	image-classificationImage Classification	—Unverified
Accelerating RNN-based Speech Enhancement on a Multi-Core MCU with Mixed FP16-INT8 Post-Training Quantization	Oct 14, 2022	QuantizationSpeech Enhancement	—Unverified
Acceleration for Compressed Gradient Descent in Distributed Optimization	Jan 1, 2020	Distributed OptimizationFederated Learning	—Unverified
Acceleration of Convolutional Neural Network Using FFT-Based Split Convolutions	Mar 27, 2020	Quantization	—Unverified
Accelerator-Aware Training for Transducer-Based Speech Recognition	May 12, 2023	CPUQuantization	—Unverified
AccLLM: Accelerating Long-Context LLM Inference Via Algorithm-Hardware Co-Design	Apr 7, 2025	Quantization	—Unverified
Accumulator-Aware Post-Training Quantization	Sep 25, 2024	image-classificationImage Classification	—Unverified
Accuracy is Not All You Need	Jul 12, 2024	AllQuantization	—Unverified
Accuracy to Throughput Trade-offs for Reduced Precision Neural Networks on Reconfigurable Logic	Jul 17, 2018	Quantization	—Unverified
Accurate Block Quantization in LLMs with Outliers	Mar 29, 2024	Quantization	—Unverified
Accurate Compression of Text-to-Image Diffusion Models via Vector Quantization	Aug 31, 2024	Image GenerationQuantization	—Unverified
Accurate Deep Representation Quantization with Gradient Snapping Layer for Similarity Search	Oct 30, 2016	Quantization	—Unverified
Accurate INT8 Training Through Dynamic Block-Level Fallback	Mar 11, 2025	Quantization	—Unverified
Accurate Sine-Wave Amplitude Measurements Using Nonlinearly Quantized Data	Apr 28, 2018	Quantization	—Unverified
A Channelized Binning Method for Extraction of Dominant Color Pixel Value	May 28, 2016	Quantization	—Unverified
Achieving binary weight and activation for LLMs using Post-Training Quantization	Apr 7, 2025	Quantization	—Unverified
Achieving Robustness in Blind Modulo Analog-to-Digital Conversion	Dec 24, 2024	Quantization	—Unverified
Differentially Quantized Gradient Methods	Feb 6, 2020	Distributed OptimizationQuantization	—Unverified
Lean classical-quantum hybrid neural network model for image classification	Dec 3, 2024	ClassificationDecision Making	—Unverified
A Closed-loop Sleep Modulation System with FPGA-Accelerated Deep Learning	Nov 19, 2022	EEGElectroencephalogram (EEG)	—Unverified
A CNN-based Prediction-Aware Quality Enhancement Framework for VVC	May 12, 2021	Quantization	—Unverified
A Genetic Algorithm Approach for ImageRepresentation Learning through Color Quantization	Nov 18, 2017	Content-Based Image RetrievalImage Description	—Unverified
A Compact and Discriminative Face Track Descriptor	Jun 1, 2014	BinarizationDimensionality Reduction	—Unverified
A comparative study of several parameterizations for speaker recognition	Feb 24, 2022	QuantizationSpeaker Recognition	—Unverified
A comparative study of several ADPCM schemes with linear and nonlinear prediction	Mar 7, 2022	PredictionQuantization	—Unverified
A comparison study of CNN denoisers on PRNU extraction	Dec 6, 2021	DenoisingImage Denoising	—Unverified

Show:10 25 50

← PrevPage 69 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified