Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 951–975 of 4925 papers

Title	Date	Tasks	Status	Hype
Deep activity propagation via weight initialization in spiking neural networks	Oct 1, 2024	Quantization	—Unverified	0
Trainable pruned ternary quantization for medical signal classification models	Oct 1, 2024	Model CompressionQuantization	CodeCode Available	0
Quantized and Asynchronous Federated Learning	Sep 30, 2024	Federated LearningQuantization	—Unverified	0
Constraint Guided Model Quantization of Neural Networks	Sep 30, 2024	modelQuantization	—Unverified	0
Mixed-Precision Embeddings for Large-Scale Recommendation Models	Sep 30, 2024	QuantizationRecommendation Systems	—Unverified	0
Accelerating PoT Quantization on Edge Devices	Sep 30, 2024	CPUQuantization	CodeCode Available	0
Aggressive Post-Training Compression on Extremely Large Language Models	Sep 30, 2024	Model CompressionNetwork Pruning	—Unverified	0
Rotated Runtime Smooth: Training-Free Activation Smoother for accurate INT4 inference	Sep 30, 2024	Quantization	—Unverified	0
InfantCryNet: A Data-driven Framework for Intelligent Analysis of Infant Cries	Sep 29, 2024	Knowledge DistillationModel Compression	—Unverified	0
Efficient Federated Intrusion Detection in 5G ecosystem using optimized BERT-based model	Sep 28, 2024	Federated LearningIntrusion Detection	CodeCode Available	0
Asymptotic tracking control of dynamic reference over homomorphically encrypted data with finite modulus	Sep 27, 2024	Quantization	—Unverified	0
Heterogeneous quantization regularizes spiking neural network activity	Sep 27, 2024	DenoisingQuantization	—Unverified	0
A method of using RSVD in residual calculation of LowBit GEMM	Sep 27, 2024	Data Free QuantizationQuantization	—Unverified	0
Fronthaul-Constrained Distributed Radar Sensing	Sep 26, 2024	Quantization	—Unverified	0
Digital and Hybrid Precoding Designs in Massive MIMO with Low-Resolution ADCs	Sep 26, 2024	Quantization	CodeCode Available	0
Language Models as Zero-shot Lossless Gradient Compressors: Towards General Neural Parameter Prior Models	Sep 26, 2024	Neural Network CompressionQuantization	CodeCode Available	0
MoGenTS: Motion Generation based on Spatial-Temporal Joint Modeling	Sep 26, 2024	Motion GenerationQuantization	—Unverified	0
Efficient Arbitrary Precision Acceleration for Large Language Models on GPU Tensor Cores	Sep 26, 2024	GPUManagement	—Unverified	0
P4Q: Learning to Prompt for Quantization in Visual-language Models	Sep 26, 2024	Quantization	—Unverified	0
Using Random Codebooks for Audio Neural AutoEncoders	Sep 25, 2024	Audio CompressionQuantization	—Unverified	0
Reinforcement Learning for Finite Space Mean-Field Type Games	Sep 25, 2024	Deep Reinforcement LearningQ-Learning	—Unverified	0
Search for Efficient Large Language Models	Sep 25, 2024	GPUModel Compression	CodeCode Available	1
AlignedKV: Reducing Memory Access of KV-Cache with Precision-Aligned Quantization	Sep 25, 2024	Quantization	CodeCode Available	0
A Survey of Low-bit Large Language Models: Basics, Systems, and Algorithms	Sep 25, 2024	Quantization	—Unverified	0
Accumulator-Aware Post-Training Quantization	Sep 25, 2024	image-classificationImage Classification	—Unverified	0

Show:10 25 50

← PrevPage 39 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified