Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 176–200 of 4925 papers

Title	Date	Tasks	Status	Hype
Gaussian Weight Sampling for Scalable, Efficient and Stable Pseudo-Quantization Training	May 16, 2025	GPUQuantization	—Unverified	0
Addition is almost all you need: Compressing neural networks with double binary factorization	May 16, 2025	AllBinarization	CodeCode Available	0
GenoArmory: A Unified Evaluation Framework for Adversarial Attacks on Genomic Foundation Models	May 16, 2025	Adversarial AttackAdversarial Defense	CodeCode Available	1
Accurate KV Cache Quantization with Outlier Tokens Tracing	May 16, 2025	Quantization	CodeCode Available	1
EA-3DGS: Efficient and Adaptive 3D Gaussians with Highly Enhanced Quality for outdoor scenes	May 16, 2025	3DGSNeRF	CodeCode Available	1
A probabilistic framework for dynamic quantization	May 15, 2025	Quantization	—Unverified	0
VQ-Logits: Compressing the Output Bottleneck of Large Language Models via Vector Quantized Logits	May 15, 2025	Language ModelingLanguage Modelling	—Unverified	0
TransPL: VQ-Code Transition Matrices for Pseudo-Labeling of Time Series Unsupervised Domain Adaptation	May 15, 2025	Domain AdaptationPseudo Label	CodeCode Available	0
Analog Foundation Models	May 14, 2025	4kQuantization	CodeCode Available	1
Zero-shot Quantization: A Comprehensive Survey	May 14, 2025	QuantizationSurvey	—Unverified	0
Efficient Mixed Precision Quantization in Graph Neural Networks	May 14, 2025	Graph ClassificationNode Classification	CodeCode Available	0
Resource-Efficient Language Models: Quantization for Fast and Accessible Inference	May 13, 2025	Quantization	—Unverified	0
Multi-Layer Hierarchical Federated Learning with Quantization	May 13, 2025	Federated LearningQuantization	—Unverified	0
Efficient ANN-SNN Conversion with Error Compensation Learning	May 12, 2025	Quantization	—Unverified	0
Cognitive Non-Coherent Jamming Techniques for Frequency Selective Attacks	May 12, 2025	Quantization	—Unverified	0
An Extra RMSNorm is All You Need for Fine Tuning to 1.58 Bits	May 12, 2025	AllKnowledge Distillation	—Unverified	0
QuantX: A Framework for Hardware-Aware Quantization of Generative AI Workloads	May 12, 2025	Quantization	—Unverified	0
Continuous Visual Autoregressive Generation via Score Maximization	May 12, 2025	Quantization	CodeCode Available	1
Bang for the Buck: Vector Search on Cloud CPUs	May 12, 2025	CPUQuantization	—Unverified	0
Private LoRA Fine-tuning of Open-Source LLMs with Homomorphic Encryption	May 12, 2025	GPUKnowledge Base Question Answering	—Unverified	0
Semantic Retention and Extreme Compression in LLMs: Can We Have Both?	May 12, 2025	Language ModelingLanguage Modelling	—Unverified	0
GuidedQuant: Large Language Model Quantization via Exploiting End Loss Guidance	May 11, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
Improving Block-Wise LLM Quantization by 4-bit Block-Wise Optimal Float (BOF4): Analysis and Variations	May 10, 2025	Language ModelingLanguage Modelling	—Unverified	0
Challenging GPU Dominance: When CPUs Outperform for On-Device LLM Inference	May 9, 2025	CPUGPU	—Unverified	0
LightNobel: Improving Sequence Length Limitation in Protein Structure Prediction Model via Adaptive Activation Quantization	May 9, 2025	Protein FoldingProtein Structure Prediction	—Unverified	0

Show:10 25 50

← PrevPage 8 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified