Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2326–2350 of 4925 papers

Title	Date	Tasks	Status
Is Conventional SNN Really Efficient? A Perspective from Network Quantization	Nov 17, 2023	FairnessQuantization	—Unverified
A Speed Odyssey for Deployable Quantization of LLMs	Nov 16, 2023	Language ModelingLanguage Modelling	—Unverified
I&S-ViT: An Inclusive & Stable Method for Pushing the Limit of Post-Training ViTs Quantization	Nov 16, 2023	Quantization	CodeCode Available
On the Impact of Calibration Data in Post-training Quantization and Pruning	Nov 16, 2023	Model CompressionQuantization	—Unverified
A Diffusion Model Based Quality Enhancement Method for HEVC Compressed Video	Nov 15, 2023	DecoderQuantization	—Unverified
Data Augmentations in Deep Weight Spaces	Nov 15, 2023	Data AugmentationNetwork Pruning	—Unverified
MetaMix: Meta-state Precision Searcher for Mixed-precision Activation Quantization	Nov 12, 2023	Quantization	—Unverified
A Different View of Sigma-Delta Modulators Under the Lens of Pulse Frequency Modulation	Nov 12, 2023	Quantization	—Unverified
EPIM: Efficient Processing-In-Memory Accelerators based on Epitome	Nov 12, 2023	Model CompressionNeural Architecture Search	—Unverified
Post-training Quantization for Text-to-Image Diffusion Models with Progressive Calibration and Activation Relaxing	Nov 10, 2023	Quantization	CodeCode Available
BICM-compatible Rate Adaptive Geometric Constellation Shaping Using Optimized Many-to-one Labeling	Nov 10, 2023	Quantization	—Unverified
In-Context Learning for MIMO Equalization Using Transformer-Based Sequence Models	Nov 10, 2023	In-Context LearningMeta-Learning	CodeCode Available
Automated Heterogeneous Low-Bit Quantization of Multi-Model Deep Learning Inference Pipeline	Nov 10, 2023	Ensemble LearningMulti-Task Learning	—Unverified
Compressed and Sparse Models for Non-Convex Decentralized Learning	Nov 9, 2023	Quantization	—Unverified
Enhancing Computation Efficiency in Large Language Models through Weight and Activation Quantization	Nov 9, 2023	Computational EfficiencyQuantization	—Unverified
Reducing the Side-Effects of Oscillations in Training of Quantized YOLO Networks	Nov 9, 2023	object-detectionObject Detection	—Unverified
RepQ: Generalizing Quantization-Aware Training for Re-Parametrized Architectures	Nov 9, 2023	Quantization	—Unverified
Learning-Based Latency-Constrained Fronthaul Compression Optimization in C-RAN	Nov 7, 2023	Deep Reinforcement LearningQuantization	—Unverified
Dissecting the Runtime Performance of the Training, Fine-tuning, and Inference of Large Language Models	Nov 7, 2023	GPUQuantization	—Unverified
Deep Hashing via Householder Quantization	Nov 7, 2023	BinarizationDeep Hashing	CodeCode Available
Generative Diffusion Models for Lattice Field Theory	Nov 6, 2023	Quantization	—Unverified
Learned layered coding for Successive Refinement in the Wyner-Ziv Problem	Nov 6, 2023	Quantization	—Unverified
Attention or Convolution: Transformer Encoders in Audio Language Models for Inference Efficiency	Nov 5, 2023	Quantization	—Unverified
Effective Quantization for Diffusion Models on CPUs	Nov 2, 2023	Quantization	—Unverified
Divergent Token Metrics: Measuring degradation to prune away LLM components -- and optimize quantization	Nov 2, 2023	ManagementModel Compression	—Unverified

Show:10 25 50

← PrevPage 94 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified