Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2101–2125 of 4925 papers

Title	Date	Tasks	Status
An Analysis on Quantizing Diffusion Transformers	Jun 16, 2024	Conditional Image GenerationDenoising	—Unverified
Improving Conversational Abilities of Quantized Large Language Models via Direct Preference Alignment	Jul 3, 2024	ChatbotComputational Efficiency	—Unverified
Improving Low-Precision Network Quantization via Bin Regularization	Jan 1, 2021	Quantization	—Unverified
Improving the Robustness of Quantized Deep Neural Networks to White-Box Attacks using Stochastic Quantization and Information-Theoretic Ensemble Training	Nov 30, 2023	DiversityInformation Plane	—Unverified
Inverted Semantic-Index for Image Retrieval	Jun 25, 2022	Clusteringimage-classification	—Unverified
Distilling Vision-Language Pretraining for Efficient Cross-Modal Retrieval	May 23, 2024	Cross-Modal RetrievalQuantization	—Unverified
SpeedLimit: Neural Architecture Search for Quantized Transformer Models	Sep 25, 2022	Neural Architecture SearchQuantization	—Unverified
Activation Map-based Vector Quantization for 360-degree Image Semantic Communication	Jun 7, 2024	QuantizationSemantic Communication	—Unverified
Distilled Low Rank Neural Radiance Field with Quantization for Light Field Compression	Jul 30, 2022	NeRFQuantization	—Unverified
Analyzing Quantization in TVM	Aug 19, 2023	Quantization	—Unverified
Improved Residual Vector Quantization for High-dimensional Approximate Nearest Neighbor Search	Sep 17, 2015	ClusteringQuantization	—Unverified
Distance-Weighted Graph Neural Networks on FPGAs for Real-Time Particle Reconstruction in High Energy Physics	Aug 8, 2020	ClusteringJet Tagging	—Unverified
Distance Encoded Product Quantization	Jun 1, 2014	Quantization	—Unverified
Distance-aware Quantization	Aug 16, 2021	Quantization	—Unverified
Bifocal Neural ASR: Exploiting Keyword Spotting for Inference Optimization	Aug 3, 2021	Inference OptimizationKeyword Spotting	—Unverified
Analyzing Compression Techniques for Computer Vision	May 14, 2023	Knowledge DistillationQuantization	—Unverified
Improved training of binary networks for human pose estimation and image recognition	Apr 11, 2019	BinarizationClassification with Binary Neural Network	—Unverified
Dissecting the Runtime Performance of the Training, Fine-tuning, and Inference of Large Language Models	Nov 7, 2023	GPUQuantization	—Unverified
DiskANN++: Efficient Page-based Search over Isomorphic Mapped Graph Index using Query-sensitivity Entry Vertex	Sep 30, 2023	QuantizationSensitivity	—Unverified
Analytical aspects of non-differentiable neural networks	Nov 3, 2020	Quantization	—Unverified
Disentangling segmental and prosodic factors to non-native speech comprehensibility	Aug 20, 2024	QuantizationVoice Similarity	—Unverified
Bielik 11B v2 Technical Report	May 5, 2025	Language ModelingLanguage Modelling	—Unverified
Analysis of the influence of final resolution on ADC accuracy	Jul 1, 2023	Quantization	—Unverified
Activation Functions for Generalized Learning Vector Quantization - A Performance Comparison	Jan 17, 2019	ClassificationGeneral Classification	—Unverified
Disentangled Representation Learning for Unsupervised Neural Quantization	Jan 1, 2023	QuantizationRepresentation Learning	—Unverified

Show:10 25 50

← PrevPage 85 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified