Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3626–3650 of 4925 papers

Title	Date	Tasks	Status
An Ultra-Efficient Memristor-Based DNN Framework with Structured Weight Pruning and Quantization Using ADMM	Aug 29, 2019	Quantization	—Unverified
APack: Off-Chip, Lossless Data Compression for Efficient Deep Learning Inference	Jan 21, 2022	Data CompressionQuantization	—Unverified
APCodec+: A Spectrum-Coding-Based High-Fidelity and High-Compression-Rate Neural Audio Codec with Staged Training Paradigm	Oct 30, 2024	DecoderQuantization	—Unverified
A Performance Analysis of You Only Look Once Models for Deployment on Constrained Computational Edge Devices in Drone Applications	Feb 6, 2025	NVIDIA Jetson Orin Nanoobject-detection	—Unverified
APG-MOS: Auditory Perception Guided-MOS Predictor for Synthetic Speech	Apr 29, 2025	Quantization	—Unverified
A Picture is Worth a Billion Bits: Real-Time Image Reconstruction from Dense Binary Pixels	Oct 15, 2015	Image ReconstructionQuantization	—Unverified
A Planck Radiation and Quantization Scheme for Human Cognition and Language	Jan 10, 2022	Quantization	—Unverified
Apollo-Forecast: Overcoming Aliasing and Inference Speed Challenges in Language Models for Time Series Forecasting	Dec 16, 2024	QuantizationTime Series	—Unverified
A Post-coder Feedback Approach to Overcome Training Asymmetry in MIMO-TDD	Jul 22, 2020	Quantization	—Unverified
Approaching Rate-Distortion Limits in Neural Compression with Lattice Transform Coding	Mar 12, 2024	Quantization	—Unverified
Approximate DCT and Quantization Techniques for Energy-Constrained Image Sensors	Jun 24, 2024	Quantization	—Unverified
Approximately Invertible Neural Network for Learned Image Compression	Aug 30, 2024	DenoisingImage Compression	—Unverified
Approximate Probabilistic Neural Networks with Gated Threshold Logic	Aug 2, 2018	General ClassificationQuantization	—Unverified
Approximate search with quantized sparse representations	Aug 10, 2016	Quantization	—Unverified
Approximation of functions with one-bit neural networks	Dec 16, 2021	Quantization	—Unverified
Approximation speed of quantized vs. unquantized ReLU neural networks and beyond	May 24, 2022	Quantization	—Unverified
A Practical Mixed Precision Algorithm for Post-Training Quantization	Feb 10, 2023	Quantization	—Unverified
A Precision-Scalable RISC-V DNN Processor with On-Device Learning Capability at the Extreme Edge	Sep 15, 2023	Quantization	—Unverified
A Principled Hierarchical Deep Learning Approach to Joint Image Compression and Classification	Oct 30, 2023	Decoderimage-classification	—Unverified
A Privacy Preserving System for Movie Recommendations Using Federated Learning	Mar 7, 2023	Federated LearningPrivacy Preserving	—Unverified
A Probabilistic Reformulation Technique for Discrete RIS Optimization in Wireless Systems	Mar 1, 2023	Quantization	—Unverified
APTQ: Attention-aware Post-Training Mixed-Precision Quantization for Large Language Models	Feb 21, 2024	Quantization	—Unverified
A QP-adaptive Mechanism for CNN-based Filter in Video Coding	Oct 25, 2020	Quantization	—Unverified
A Quantitative Approach To The Temporal Dependency in Video Coding	Aug 26, 2021	Motion CompensationQuantization	—Unverified
A Quantization-based Technique for Privacy Preserving Distributed Learning	Jun 26, 2024	Privacy PreservingQuantization	—Unverified

Show:10 25 50

← PrevPage 146 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified