Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3501–3550 of 4925 papers

Title	Date	Tasks	Status
AddNet: Deep Neural Networks Using FPGA-Optimized Multipliers	Nov 19, 2019	Quantization	—Unverified
A Deep Hashing Learning Network	Jul 16, 2015	Deep HashingQuantization	—Unverified
A Deep Learning Inference Scheme Based on Pipelined Matrix Multiplication Acceleration Design and Non-uniform Quantization	Oct 10, 2021	Edge-computingQ-Learning	—Unverified
ADFQ-ViT: Activation-Distribution-Friendly Post-Training Quantization for Vision Transformers	Jul 3, 2024	Attributeimage-classification	—Unverified
A Different View of Sigma-Delta Modulators Under the Lens of Pulse Frequency Modulation	Nov 12, 2023	Quantization	—Unverified
A Diffusion Model Based Quality Enhancement Method for HEVC Compressed Video	Nov 15, 2023	DecoderQuantization	—Unverified
A Directed-Evolution Method for Sparsification and Compression of Neural Networks with Application to Object Identification and Segmentation and considerations of optimal quantization using small number of bits	Jun 12, 2022	Quantization	—Unverified
ADMM Based Semi-Structured Pattern Pruning Framework For Transformer	Jul 11, 2024	CoLAQuantization	—Unverified
AdpQ: A Zero-shot Calibration Free Adaptive Post Training Quantization Method for LLMs	May 22, 2024	Privacy PreservingQuantization	—Unverified
Adversarial Attack on Deep Product Quantization Network for Image Retrieval	Feb 26, 2020	Adversarial AttackImage Retrieval	—Unverified
Adversarial Defenses via Vector Quantization	May 23, 2023	Quantization	—Unverified
Sparsity Turns Adversarial: Energy and Latency Attacks on Deep Neural Networks	Jun 14, 2020	Computational EfficiencyQuantization	—Unverified
Adverse Weather Removal with Codebook Priors	Jan 1, 2023	Quantization	—Unverified
A Faster Approach to Spiking Deep Convolutional Neural Networks	Oct 31, 2022	Dimensionality ReductionQuantization	—Unverified
A Fast Network Exploration Strategy to Profile Low Energy Consumption for Keyword Spotting	Feb 4, 2022	Keyword SpottingQuantization	—Unverified
A Feature-map Discriminant Perspective for Pruning Deep Neural Networks	May 28, 2020	Network PruningQuantization	—Unverified
A Federated Reinforcement Learning Method with Quantization for Cooperative Edge Caching in Fog Radio Access Networks	Jun 23, 2022	Deep Reinforcement LearningQuantization	—Unverified
A flexible, extensible software framework for model compression based on the LC algorithm	May 15, 2020	BIG-bench Machine LearningLow-rank compression	—Unverified
A Flexible, Extensible Software Framework for Neural Net Compression	Oct 20, 2018	Quantization	—Unverified
A Formalization of Image Vectorization by Region Merging	Sep 24, 2024	Image SegmentationQuantization	—Unverified
A General Error-Theoretical Analysis Framework for Constructing Compression Strategies	Feb 19, 2025	Quantization	—Unverified
A General Family of Stochastic Proximal Gradient Methods for Deep Learning	Jul 15, 2020	Quantization	—Unverified
A Generalized Zero-Shot Quantization of Deep Convolutional Neural Networks via Learned Weights Statistics	Dec 6, 2021	Quantization	—Unverified
Aggregated Learning: A Deep Learning Framework Based on Information-Bottleneck Vector Quantization	Jul 26, 2018	Image ClassificationQuantization	—Unverified
Aggregating empirical evidence from data strategy studies: a case on model quantization	May 1, 2025	GPUQuantization	—Unverified
Aggressive Post-Training Compression on Extremely Large Language Models	Sep 30, 2024	Model CompressionNetwork Pruning	—Unverified
AgileIR: Memory-Efficient Group Shifted Windows Attention for Agile Image Restoration	Sep 10, 2024	Image RestorationQuantization	—Unverified
A Greedy Bit-flip Training Algorithm for Binarized Knowledge Graph Embeddings	Nov 1, 2020	Graph EmbeddingKnowledge Graph Completion	—Unverified
A Gridless Compressive Sensing Based Channel Estimation for Millimeter Wave MIMO OFDM Systems with One-Bit Quantization	Aug 19, 2019	Compressive SensingQuantization	—Unverified
AHCPTQ: Accurate and Hardware-Compatible Post-Training Quantization for Segment Anything Model	Mar 5, 2025	Instance SegmentationQuantization	—Unverified
A Highly Effective Low-Rank Compression of Deep Neural Networks with Modified Beam-Search and Modified Stable Rank	Nov 30, 2021	Low-rank compressionQuantization	—Unverified
A High-Performance Adaptive Quantization Approach for Edge CNN Applications	Jul 18, 2021	image-classificationImage Classification	—Unverified
Machine learning-driven conservative-to-primitive conversion in hybrid piecewise polytropic and tabulated equations of state	Dec 10, 2024	CPUGPU	—Unverified
AI Enlightens Wireless Communication: Analyses, Solutions and Opportunities on CSI Feedback	Jun 12, 2021	Quantization	—Unverified
AIQViT: Architecture-Informed Post-Training Quantization for Vision Transformers	Feb 7, 2025	image-classificationImage Classification	—Unverified
A Joint Model and Data Driven Method for Distributed Estimation	Mar 30, 2023	QuantizationWeather Forecasting	—Unverified
AKVQ-VL: Attention-Aware KV Cache Adaptive 2-Bit Quantization for Vision-Language Models	Jan 25, 2025	Quantization	—Unverified
AKVSR: Audio Knowledge Empowered Visual Speech Recognition by Compressing Audio Knowledge of a Pretrained Model	Aug 15, 2023	Quantizationspeech-recognition	—Unverified
A Latent-Variable Lattice Model	Dec 23, 2015	modelQuantization	—Unverified
A Layer-wise Adversarial-aware Quantization Optimization for Improving Robustness	Oct 23, 2021	Quantization	—Unverified
Algorithmic trading in a microstructural limit order book model	May 3, 2017	Algorithmic TradingPoint Processes	—Unverified
Algorithms for the Communication of Samples	Oct 25, 2021	Quantization	—Unverified
Aligned Vector Quantization for Edge-Cloud Collabrative Vision-Language Models	Nov 8, 2024	QuantizationQuestion Answering	—Unverified
A Linearly Convergent Algorithm for Decentralized Optimization: Sending Less Bits for Free!	Nov 3, 2020	Quantization	—Unverified
A Linear Speedup Analysis of Distributed Deep Learning with Sparse and Quantized Communication	Dec 1, 2018	Quantization	—Unverified
ALISE: Accelerating Large Language Model Serving with Speculative Scheduling	Oct 31, 2024	BlockingLanguage Modeling	—Unverified
Improved Techniques for Quantizing Deep Networks with Adaptive Bit-Widths	Mar 2, 2021	image-classificationImage Classification	—Unverified
All-Digital LoS MIMO with Low-Precision Analog-to-Digital Conversion	Aug 2, 2021	AllQuantization	—Unverified
All Rivers Run to the Sea: Private Learning with Asymmetric Flows	Dec 5, 2023	AllQuantization	—Unverified
A Lottery Ticket Hypothesis Framework for Low-Complexity Device-Robust Neural Acoustic Scene Classification	Jul 3, 2021	Acoustic Scene ClassificationData Augmentation	—Unverified

Show:10 25 50

← PrevPage 71 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified