Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2251–2300 of 4925 papers

Title	Date	Tasks	Status
A Comprehensive Survey on Vector Database: Storage and Retrieval Technique, Challenge	Oct 18, 2023	ArticlesQuantization	—Unverified
Dequantization of a signal from two parallel quantized observations	Sep 12, 2024	Quantization	—Unverified
Breaking the Hourglass Phenomenon of Residual Quantization: Enhancing the Upper Bound of Generative Retrieval	Jul 31, 2024	QuantizationRecommendation Systems	—Unverified
KV Cache is 1 Bit Per Channel: Efficient Large Language Model Inference with Coupled Quantization	May 7, 2024	GPULanguage Modeling	—Unverified
KVmix: Gradient-Based Layer Importance-Aware Mixed-Precision Quantization for KV Cache	May 18, 2025	Quantization	—Unverified
Language Models and Retrieval Augmented Generation for Automated Structured Data Extraction from Diagnostic Reports	Sep 15, 2024	DiagnosticModel Selection	—Unverified
Energy-efficient Deployment of Deep Learning Applications on Cortex-M based Microcontrollers using Deep Compression	May 20, 2022	Quantization	—Unverified
Deployment of Deep Neural Networks for Object Detection on Edge AI Devices with Runtime Optimization	Aug 18, 2021	2D Object Detection3D Object Detection	—Unverified
BasisConv: A method for compressed representation and learning in CNNs	Jun 11, 2019	Quantization	—Unverified
Deploy Large-Scale Deep Neural Networks in Resource Constrained IoT Devices with Local Quantization Region	May 24, 2018	Quantization	—Unverified
Deploying Large AI Models on Resource-Limited Devices with Split Federated Learning	Apr 12, 2025	Federated LearningQuantization	—Unverified
BasedAI: A decentralized P2P network for Zero Knowledge Large Language Models (ZK-LLMs)	Mar 1, 2024	Language ModelingLanguage Modelling	—Unverified
Amenable Sparse Network Investigator	Feb 18, 2022	Quantization	—Unverified
Bang for the Buck: Vector Search on Cloud CPUs	May 12, 2025	CPUQuantization	—Unverified
A Memory-Efficient Learning Framework for SymbolLevel Precoding with Quantized NN Weights	Oct 13, 2021	Model CompressionQuantization	—Unverified
Conditional Denoising Diffusion Probabilistic Models for Data Reconstruction Enhancement in Wireless Communications	Oct 30, 2023	DenoisingQuantization	—Unverified
Demystifying Singular Defects in Large Language Models	Feb 10, 2025	Quantization	—Unverified
Bandwidth-efficient Inference for Neural Image Compression	Sep 6, 2023	Data CompressionImage Compression	—Unverified
A Comprehensive Survey on Model Quantization for Deep Neural Networks in Image Classification	May 14, 2022	image-classificationImage Classification	—Unverified
DeltaKWS: A 65nm 36nJ/Decision Bio-inspired Temporal-Sparsity-Aware Digital Keyword Spotting IC with 0.6V Near-Threshold SRAM	May 6, 2024	channel selectionKeyword Spotting	—Unverified
Demystifying and Generalizing BinaryConnect	Oct 25, 2021	Quantization	—Unverified
Delving into Channels: Exploring Hyperparameter Space of Channel Bit Widths with Linear Complexity	Sep 29, 2021	CPUQuantization	—Unverified
DeltaDQ: Ultra-High Delta Compression for Fine-Tuned LLMs via Group-wise Dropout and Separate Quantization	Oct 11, 2024	DiversityQuantization	—Unverified
Bandlimited signal reconstruction from leaky integrate-and-fire encoding using POCS	Jan 9, 2022	QuantizationRetrieval	—Unverified
Degree-Quant: Quantization-Aware Training for Graph Neural Networks	Aug 11, 2020	CPUGraph Classification	—Unverified
Defensive Quantization: When Efficiency Meets Robustness	Apr 17, 2019	Adversarial AttackCPU	—Unverified
BAMSProd: A Step towards Generalizing the Adaptive Optimization Methods to Deep Binary Model	Sep 29, 2020	Quantization	—Unverified
Defend Deep Neural Networks Against Adversarial Examples via Fixed and Dynamic Quantized Activation Functions	Jul 18, 2018	Quantization	—Unverified
Deep Visual-Semantic Quantization for Efficient Image Retrieval	Jul 1, 2017	Image RetrievalQuantization	—Unverified
Balancing Robustness and Efficiency in Embedded DNNs Through Activation Function Selection	Apr 7, 2025	Autonomous DrivingDecoder	—Unverified
A Markovian Model-Driven Deep Learning Framework for Massive MIMO CSI Feedback	Sep 20, 2020	QuantizationScheduling	—Unverified
A Comprehensive Survey of Compression Algorithms for Language Models	Jan 27, 2024	Knowledge DistillationQuantization	—Unverified
KurTail : Kurtosis-based LLM Quantization	Mar 3, 2025	GPULanguage Modeling	—Unverified
Deep Unsupervised Learning for Joint Antenna Selection and Hybrid Beamforming	Jun 6, 2021	Quantization	—Unverified
Deep Unfolding with Kernel-based Quantization in MIMO Detection	May 19, 2025	Density EstimationEdge-computing	—Unverified
Balance of Number of Embedding and their Dimensions in Vector Quantization	Jul 6, 2024	Quantization	—Unverified
DeepTwist: Learning Model Compression via Occasional Weight Distortion	Oct 30, 2018	modelModel Compression	—Unverified
Balanced Quantization: An Effective and Efficient Approach to Quantized Neural Networks	Jun 22, 2017	Quantization	—Unverified
Alternating Multi-bit Quantization for Recurrent Neural Networks	Feb 1, 2018	image-classificationImage Classification	—Unverified
Knowledge Transfer in Model-Based Reinforcement Learning Agents for Efficient Multi-Task Learning	Jan 9, 2025	Model-based Reinforcement LearningMulti-Task Learning	—Unverified
Deep Task-Based Quantization	Aug 1, 2019	Quantization	—Unverified
Deep Spherical Quantization for Image Search	Jun 7, 2019	Image RetrievalQuantization	—Unverified
Bag of Tricks with Quantized Convolutional Neural Networks for image classification	Mar 13, 2023	image-classificationImage Classification	—Unverified
Alternating Direction Method of Multipliers for Quantization	Sep 8, 2020	Quantization	—Unverified
Koopman Meets Limited Bandwidth: Effect of Quantization on Data-Driven Linear Prediction and Control of Nonlinear Systems	Jan 13, 2025	Model Predictive ControlQuantization	—Unverified
Deep Signal Recovery with One-Bit Quantization	Nov 30, 2018	BIG-bench Machine LearningComputational Efficiency	—Unverified
Alternating Co-Quantization for Cross-Modal Hashing	Dec 1, 2015	Cross-Modal RetrievalDimensionality Reduction	—Unverified
K-Means Hashing: An Affinity-Preserving Quantization Method for Learning Binary Compact Codes	Jun 1, 2013	ClusteringQuantization	—Unverified
Deep Saliency Hashing	Jul 4, 2018	Deep HashingQuantization	—Unverified
Back to Simplicity: How to Train Accurate BNNs from Scratch?	Jun 19, 2019	Quantization	—Unverified

Show:10 25 50

← PrevPage 46 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified