Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1951–1975 of 4925 papers

Title	Date	Tasks	Status
Bit Efficient Quantization for Deep Neural Networks	Oct 7, 2019	ClusteringQuantization	—Unverified
Generative AI in Cybersecurity: A Comprehensive Review of LLM Applications and Vulnerabilities	May 21, 2024	Data PoisoningIntrusion Detection	—Unverified
A blob method for inhomogeneous diffusion with applications to multi-agent control and sampling	Feb 25, 2022	Quantization	—Unverified
Generative Design of Hardware-aware DNNs	Jun 6, 2020	Quantization	—Unverified
Generative Diffusion Models for Lattice Field Theory	Nov 6, 2023	Quantization	—Unverified
HEQuant: Marrying Homomorphic Encryption and Quantization for Communication-Efficient Private Inference	Jan 29, 2024	Quantization	—Unverified
Generative QoE Modeling: A Lightweight Approach for Telecom Networks	Apr 30, 2025	Computational EfficiencyQuantization	—Unverified
Generative Semantic Communication for Text-to-Speech Synthesis	Oct 4, 2024	QuantizationSemantic Communication	—Unverified
Hexcute: A Tile-based Programming Language with Automatic Layout and Task-Mapping Synthesis	Apr 22, 2025	GPUQuantization	—Unverified
DoTA: Weight-Decomposed Tensor Adaptation for Large Language Models	Dec 30, 2024	Arithmetic ReasoningQuantization	—Unverified
Convergence Rates for Regularized Optimal Transport via Quantization	Aug 30, 2022	Quantization	—Unverified
A Biresolution Spectral Framework for Product Quantization	Jun 1, 2018	Quantization	—Unverified
Don't Waste Your Bits! Squeeze Activations and Gradients for Deep Neural Networks via TinyScript	Jan 1, 2020	Quantization	—Unverified
Geometry and clustering with metrics derived from separable Bregman divergences	Oct 25, 2018	ClusteringQuantization	—Unverified
Gesture2Text: A Generalizable Decoder for Word-Gesture Keyboards in XR Through Trajectory Coarse Discretization and Pre-training	Oct 8, 2024	DecoderQuantization	—Unverified
Getting Free Bits Back from Rotational Symmetries in LLMs	Oct 2, 2024	Quantization	—Unverified
BiTAT: Neural Network Binarization with Task-dependent Aggregated Transformation	Jul 4, 2022	BinarizationQuantization	—Unverified
An Empirical Study towards Characterizing Deep Learning Development and Deployment across Different Frameworks and Platforms	Sep 15, 2019	Adversarial AttackAdversarial Robustness	—Unverified
HDR Imaging With One-Bit Quantization	Sep 7, 2023	Quantization	—Unverified
GIF2Video: Color Dequantization and Temporal Interpolation of GIF images	Jan 9, 2019	Quantization	—Unverified
Don't Fear the Bit Flips: Optimized Coding Strategies for Binary Classification	Mar 8, 2017	Binary ClassificationGeneral Classification	—Unverified
Givens Coordinate Descent Methods for Rotation Matrix Learning in Trainable Embedding Indexes	Mar 9, 2022	Quantization	—Unverified
Domain Generalization on Efficient Acoustic Scene Classification using Residual Normalization	Nov 12, 2021	Acoustic Scene ClassificationClassification	—Unverified
BiSup: Bidirectional Quantization Error Suppression for Large Language Models	May 24, 2024	parameter-efficient fine-tuningQuantization	—Unverified
AdaComp : Adaptive Residual Gradient Compression for Data-Parallel Distributed Training	Dec 7, 2017	Quantization	—Unverified

Show:10 25 50

← PrevPage 79 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified