Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2126–2150 of 4925 papers

Title	Date	Tasks	Status
Disentangled Representation Learning for Unsupervised Neural Quantization	Jan 1, 2023	QuantizationRepresentation Learning	—Unverified
Discriminative Cross-View Binary Representation Learning	Apr 4, 2018	Image RetrievalQuantization	—Unverified
Discrete-Valued Neural Networks Using Variational Inference	Jan 1, 2018	QuantizationVariational Inference	—Unverified
BICM-compatible Rate Adaptive Geometric Constellation Shaping Using Optimized Many-to-one Labeling	Nov 10, 2023	Quantization	—Unverified
Improving the Robustness of Quantized Deep Neural Networks to White-Box Attacks using Stochastic Quantization and Information-Theoretic Ensemble Training	Nov 30, 2023	DiversityInformation Plane	—Unverified
Increasing Compactness Of Deep Learning Based Speech Enhancement Models With Parameter Pruning And Quantization Techniques	May 31, 2019	DenoisingQuantization	—Unverified
Discrete-Valued Neural Communication	Jul 6, 2021	QuantizationSystematic Generalization	—Unverified
Improving Robustness Against Adversarial Attacks with Deeply Quantized Neural Networks	Apr 25, 2023	Adversarial RobustnessQuantization	—Unverified
Analysis of Quantized Models	May 1, 2019	Quantization	—Unverified
Improving Quantization with Post-Training Model Expansion	Mar 21, 2025	Large Language Modelmodel	—Unverified
Improving Statistical Significance in Human Evaluation of Automatic Metrics via Soft Pairwise Accuracy	Sep 15, 2024	Quantization	—Unverified
BF-IMNA: A Bit Fluid In-Memory Neural Architecture for Neural Network Acceleration	Nov 3, 2024	Quantization	—Unverified
Discrete Contrastive Learning for Diffusion Policies in Autonomous Driving	Mar 7, 2025	Autonomous DrivingAutonomous Vehicles	—Unverified
Activation Density based Mixed-Precision Quantization for Energy Efficient Neural Networks	Jan 12, 2021	Model CompressionQuantization	—Unverified
Beyond Throughput and Compression Ratios: Towards High End-to-end Utility of Gradient Compression	Jul 1, 2024	Quantization	—Unverified
Discrete Audio Representation as an Alternative to Mel-Spectrograms for Speaker and Speech Recognition	Sep 19, 2023	Language ModelingLanguage Modelling	—Unverified
Analysis of Quantization on MLP-based Vision Models	Sep 14, 2022	Model CompressionQuantization	—Unverified
Improving Quantization-aware Training of Low-Precision Network via Block Replacement on Full-Precision Counterpart	Dec 20, 2024	Quantization	—Unverified
Improving the accuracy of neural networks in analog computing-in-memory systems by a generalized quantization method	Jan 1, 2021	image-classificationImage Classification	—Unverified
Beyond the Tip of Efficiency: Uncovering the Submerged Threats of Jailbreak Attacks in Small Language Models	Feb 27, 2025	Knowledge DistillationModel Compression	—Unverified
Discovering Patterns in Time-Varying Graphs: A Triclustering Approach	Aug 29, 2016	ClusteringQuantization	—Unverified
Analysis of Oversampling in Uplink Massive MIMO-OFDM with Low-Resolution ADCs	Jun 30, 2023	Quantization	—Unverified
Discovering Low-Precision Networks Close to Full-Precision Networks for Efficient Embedded Inference	Sep 11, 2018	General ClassificationQuantization	—Unverified
DisCoRD: Discrete Tokens to Continuous Motion via Rectified Flow Decoding	Nov 29, 2024	Motion SynthesisQuantization	—Unverified
Beyond Task Vectors: Selective Task Arithmetic Based on Importance Metrics	Nov 25, 2024	Knowledge DistillationMulti-Task Learning	—Unverified

Show:10 25 50

← PrevPage 86 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified