Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1476–1500 of 4925 papers

Title	Date	Tasks	Status
Federated Split Learning with Model Pruning and Gradient Quantization in Wireless Networks	Dec 9, 2024	Federated LearningQuantization	—Unverified
Fuzzy Norm-Explicit Product Quantization for Recommender Systems	Dec 8, 2024	QuantizationRecommendation Systems	—Unverified
Vision Transformer-based Semantic Communications With Importance-Aware Quantization	Dec 8, 2024	image-classificationImage Classification	—Unverified
SizeGS: Size-aware Compression of 3D Gaussians with Hierarchical Mixed Precision Quantization	Dec 8, 2024	3DGSAttribute	—Unverified
Taming Sensitive Weights : Noise Perturbation Fine-tuning for Robust LLM Quantization	Dec 8, 2024	Quantization	—Unverified
Error Feedback Approach for Quantization Noise Reduction of Distributed Graph Filters	Dec 7, 2024	Quantization	—Unverified
Sensor Selection and Distributed Quantization for Energy Efficiency in Massive MTC	Dec 7, 2024	Quantization	—Unverified
GAQAT: gradient-adaptive quantization-aware training for domain generalization	Dec 7, 2024	Domain GeneralizationQuantization	—Unverified
Efficient Distributed Training through Gradient Compression with Sparsification and Quantization Techniques	Dec 7, 2024	Quantization	—Unverified
Trimming Down Large Spiking Vision Transformers via Heterogeneous Quantization Search	Dec 7, 2024	Model CompressionQuantization	—Unverified
ULMRec: User-centric Large Language Model for Sequential Recommendation	Dec 7, 2024	Language ModelingLanguage Modelling	—Unverified
SKIM: Any-bit Quantization Pushing The Limits of Post-Training Quantization	Dec 5, 2024	ClusteringGPU	—Unverified
Quantized and Interpretable Learning Scheme for Deep Neural Networks in Classification Task	Dec 5, 2024	image-classificationImage Classification	—Unverified
Unifying KV Cache Compression for Large Language Models with LeanKV	Dec 4, 2024	GPUQuantization	—Unverified
FlashAttention on a Napkin: A Diagrammatic Approach to Deep Learning IO-Awareness	Dec 4, 2024	GPUQuantization	—Unverified
Prompting Large Language Models for Clinical Temporal Relation Extraction	Dec 4, 2024	DecoderQuantization	—Unverified
Designing DNNs for a trade-off between robustness and processing performance in embedded devices	Dec 4, 2024	Autonomous DrivingQuantization	—Unverified
Evaluating Single Event Upsets in Deep Neural Networks for Semantic Segmentation: an embedded system perspective	Dec 4, 2024	Autonomous DrivingQuantization	CodeCode Available
Mixed-Precision Quantization: Make the Best Use of Bits Where They Matter Most	Dec 4, 2024	Quantization	—Unverified
CPTQuant -- A Novel Mixed Precision Post-Training Quantization Techniques for Large Language Models	Dec 3, 2024	Language ModelingLanguage Modelling	—Unverified
3D representation in 512-Byte:Variational tokenizer is the key for autoregressive 3D generation	Dec 3, 2024	3D GenerationImage Generation	—Unverified
CEGI: Measuring the trade-off between efficiency and carbon emissions for SLMs and VLMs	Dec 3, 2024	Image CaptioningQuantization	—Unverified
Robust Precoding for Multi-User Visible Light Communications with Quantized Channel Information	Dec 3, 2024	Quantization	—Unverified
Scaling Image Tokenizers with Grouped Spherical Quantization	Dec 3, 2024	Quantization	CodeCode Available
Lean classical-quantum hybrid neural network model for image classification	Dec 3, 2024	ClassificationDecision Making	—Unverified

Show:10 25 50

← PrevPage 60 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified