Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1676–1700 of 4925 papers

Title	Date	Tasks	Status
InfantCryNet: A Data-driven Framework for Intelligent Analysis of Infant Cries	Sep 29, 2024	Knowledge DistillationModel Compression	—Unverified
Efficient Federated Intrusion Detection in 5G ecosystem using optimized BERT-based model	Sep 28, 2024	Federated LearningIntrusion Detection	CodeCode Available
Asymptotic tracking control of dynamic reference over homomorphically encrypted data with finite modulus	Sep 27, 2024	Quantization	—Unverified
A method of using RSVD in residual calculation of LowBit GEMM	Sep 27, 2024	Data Free QuantizationQuantization	—Unverified
Heterogeneous quantization regularizes spiking neural network activity	Sep 27, 2024	DenoisingQuantization	—Unverified
Fronthaul-Constrained Distributed Radar Sensing	Sep 26, 2024	Quantization	—Unverified
Language Models as Zero-shot Lossless Gradient Compressors: Towards General Neural Parameter Prior Models	Sep 26, 2024	Neural Network CompressionQuantization	CodeCode Available
MoGenTS: Motion Generation based on Spatial-Temporal Joint Modeling	Sep 26, 2024	Motion GenerationQuantization	—Unverified
Efficient Arbitrary Precision Acceleration for Large Language Models on GPU Tensor Cores	Sep 26, 2024	GPUManagement	—Unverified
Digital and Hybrid Precoding Designs in Massive MIMO with Low-Resolution ADCs	Sep 26, 2024	Quantization	CodeCode Available
P4Q: Learning to Prompt for Quantization in Visual-language Models	Sep 26, 2024	Quantization	—Unverified
Reinforcement Learning for Finite Space Mean-Field Type Games	Sep 25, 2024	Deep Reinforcement LearningQ-Learning	—Unverified
A Survey of Low-bit Large Language Models: Basics, Systems, and Algorithms	Sep 25, 2024	Quantization	—Unverified
Accumulator-Aware Post-Training Quantization	Sep 25, 2024	image-classificationImage Classification	—Unverified
LLaMa-SciQ: An Educational Chatbot for Answering Science MCQ	Sep 25, 2024	ChatbotGSM8K	—Unverified
Using Random Codebooks for Audio Neural AutoEncoders	Sep 25, 2024	Audio CompressionQuantization	—Unverified
PTQ4RIS: Post-Training Quantization for Referring Image Segmentation	Sep 25, 2024	Image SegmentationQuantization	CodeCode Available
AlignedKV: Reducing Memory Access of KV-Cache with Precision-Aligned Quantization	Sep 25, 2024	Quantization	CodeCode Available
A Formalization of Image Vectorization by Region Merging	Sep 24, 2024	Image SegmentationQuantization	—Unverified
Ultra-low latency quantum-inspired machine learning predictors implemented on FPGA	Sep 24, 2024	QuantizationTensor Networks	—Unverified
Communication and Energy Efficient Federated Learning using Zero-Order Optimization Technique	Sep 24, 2024	Federated LearningQuantization	—Unverified
Twin Network Augmentation: A Novel Training Strategy for Improved Spiking Neural Networks and Efficient Weight Quantization	Sep 24, 2024	Knowledge DistillationQuantization	—Unverified
Disentanglement with Factor Quantized Variational Autoencoders	Sep 23, 2024	DisentanglementInductive Bias	CodeCode Available
Thinking in Granularity: Dynamic Quantization for Image Super-Resolution by Intriguing Multi-Granularity Clues	Sep 22, 2024	Image Super-ResolutionQuantization	CodeCode Available
SPAQ-DL-SLAM: Towards Optimizing Deep Learning-based SLAM for Resource-Constrained Embedded Platforms	Sep 22, 2024	QuantizationSimultaneous Localization and Mapping	—Unverified

Show:10 25 50

← PrevPage 68 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified