Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3551–3600 of 4925 papers

Title	Date	Tasks	Status
A Low Memory Footprint Quantized Neural Network for Depth Completion of Very Sparse Time-of-Flight Depth Maps	May 25, 2022	DecoderDepth Completion	—Unverified
AlphaTuning: Quantization-Aware Parameter-Efficient Adaptation of Large-Scale Pre-Trained Language Models	Oct 8, 2022	Language ModelingLanguage Modelling	—Unverified
Alternate Learning based Sparse Semantic Communications for Visual Transmission	Jul 31, 2023	QuantizationSemantic Communication	—Unverified
Alternating Co-Quantization for Cross-Modal Hashing	Dec 1, 2015	Cross-Modal RetrievalDimensionality Reduction	—Unverified
Alternating Direction Method of Multipliers for Quantization	Sep 8, 2020	Quantization	—Unverified
Alternating Multi-bit Quantization for Recurrent Neural Networks	Feb 1, 2018	image-classificationImage Classification	—Unverified
A Markovian Model-Driven Deep Learning Framework for Massive MIMO CSI Feedback	Sep 20, 2020	QuantizationScheduling	—Unverified
A Memory-Efficient Learning Framework for SymbolLevel Precoding with Quantized NN Weights	Oct 13, 2021	Model CompressionQuantization	—Unverified
Amenable Sparse Network Investigator	Feb 18, 2022	Quantization	—Unverified
A method of using RSVD in residual calculation of LowBit GEMM	Sep 27, 2024	Data Free QuantizationQuantization	—Unverified
A Modular Neural Network Based Deep Learning Approach for MIMO Signal Detection	Apr 1, 2020	Quantization	—Unverified
A multi-layer image representation using Regularized Residual Quantization: application to compression and denoising	Jul 7, 2017	DenoisingQuantization	—Unverified
AMXFP4: Taming Activation Outliers with Asymmetric Microscaling Floating-Point for 4-bit LLM Inference	Nov 15, 2024	QuantizationQuestion Answering	—Unverified
An Adaptive Device-Edge Co-Inference Framework Based on Soft Actor-Critic	Jan 9, 2022	CPUDeep Reinforcement Learning	—Unverified
An adaptive random experiment design method for engineering experiment	Aug 27, 2020	Experimental DesignQuantization	—Unverified
An Adaptive Statistical Non-uniform Quantizer for Detail Wavelet Components in Lossy JPEG2000 Image Compression	May 9, 2013	Image CompressionQuantization	—Unverified
An Additive Latent Feature Model for Transparent Object Recognition	Dec 1, 2009	ObjectObject Recognition	—Unverified
Analog-digital Scheduling for Federated Learning: A Communication-Efficient Approach	Feb 1, 2024	Federated LearningQuantization	—Unverified
Analog Spiking Neuron in CMOS 28 nm Towards Large-Scale Neuromorphic Processors	Aug 14, 2024	Quantization	—Unverified
Analysis and Optimization for RIS-Aided Multi-Pair Communications Relying on Statistical CSI	Jul 22, 2020	Quantization	—Unverified
Analysis of Null Related Beampattern Measures and Signal Quantization Effects for Linear Differential Microphone Arrays	Jun 26, 2025	Quantization	—Unverified
Analysis of Oversampling in Uplink Massive MIMO-OFDM with Low-Resolution ADCs	Jun 30, 2023	Quantization	—Unverified
Analysis of Quantization on MLP-based Vision Models	Sep 14, 2022	Model CompressionQuantization	—Unverified
Analysis of Quantized Models	May 1, 2019	Quantization	—Unverified
Analysis of the influence of final resolution on ADC accuracy	Jul 1, 2023	Quantization	—Unverified
Analytical aspects of non-differentiable neural networks	Nov 3, 2020	Quantization	—Unverified
Analyzing Compression Techniques for Computer Vision	May 14, 2023	Knowledge DistillationQuantization	—Unverified
Analyzing Quantization in TVM	Aug 19, 2023	Quantization	—Unverified
An Analysis on Quantizing Diffusion Transformers	Jun 16, 2024	Conditional Image GenerationDenoising	—Unverified
An anatomy-based V1 model: Extraction of Low-level Features, Reduction of distortion and a V1-inspired SOM	Feb 18, 2023	AnatomyContour Detection	—Unverified
An Application of Backpropagation Artificial Neural Network Method for Measuring The Severity of Osteoarthritis	Sep 29, 2013	Quantization	—Unverified
An Automata-Theoretic Approach to Synthesizing Binarized Neural Networks	Jul 29, 2023	FairnessQuantization	—Unverified
An Efficient Index for Visual Search in Appearance-based SLAM	Sep 27, 2013	ClusteringQuantization	—Unverified
An Efficient Network with Novel Quantization Designed for Massive MIMO CSI Feedback	May 30, 2024	Quantization	—Unverified
An Embedded Iris Recognition System Optimization using Dynamically ReconfigurableDecoder with LDPC Codes	Jul 8, 2021	DecoderIris Recognition	—Unverified
An Empirical Study of Low Precision Quantization for TinyML	Mar 10, 2022	BIG-bench Machine LearningModel Compression	—Unverified
An Empirical Study towards Characterizing Deep Learning Development and Deployment across Different Frameworks and Platforms	Sep 15, 2019	Adversarial AttackAdversarial Robustness	—Unverified
An End-to-End DNN Inference Framework for the SpiNNaker2 Neuromorphic MPSoC	Jul 18, 2025	QuantizationScheduling	—Unverified
A "Network Pruning Network" Approach to Deep Model Compression	Jan 15, 2020	Knowledge DistillationModel Compression	—Unverified
A new heuristic algorithm for fast k-segmentation	Sep 2, 2020	QuantizationSegmentation	—Unverified
A New Learning Method for Inference Accuracy, Core Occupation, and Performance Co-optimization on TrueNorth Chip	Apr 3, 2016	General ClassificationQuantization	—Unverified
A New Old Idea: Beam-Steering Reflectarrays for Efficient Sub-THz Multiuser MIMO	Nov 30, 2023	3D geometryQuantization	—Unverified
An Exact Quantized Decentralized Gradient Descent Algorithm	Jun 29, 2018	Distributed OptimizationQuantization	—Unverified
An Experimental Study: Assessing the Combined Framework of WavLM and BEST-RQ for Text-to-Speech Synthesis	Dec 8, 2023	BenchmarkingQuantization	—Unverified
An Experimental Study of Reduced-Voltage Operation in Modern FPGAs for Neural Network Acceleration	May 4, 2020	image-classificationImage Classification	—Unverified
An Extra RMSNorm is All You Need for Fine Tuning to 1.58 Bits	May 12, 2025	AllKnowledge Distillation	—Unverified
Angle Estimation of a Single Source with Massive Uniform Circular Arrays	Jul 17, 2025	Quantization	—Unverified
Angular Quantization-based Binary Codes for Fast Similarity Search	Dec 1, 2012	QuantizationRetrieval	—Unverified
An Implementation of Vector Quantization using the Genetic Algorithm Approach	Feb 16, 2021	ArticlesBIG-bench Machine Learning	—Unverified
An Improved BKW Algorithm for LWE with Applications to Cryptography and Lattices	Jun 8, 2015	Quantization	—Unverified

Show:10 25 50

← PrevPage 72 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified