Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2151–2175 of 4925 papers

Title	Date	Tasks	Status	Hype
Magnificent Minified Models	Jun 16, 2023	Quantization	—Unverified	0
ZeRO++: Extremely Efficient Collective Communication for Giant Model Training	Jun 16, 2023	GPUQuantization	—Unverified	0
HiNeRV: Video Compression with Hierarchical Encoding-based Neural Representation	Jun 16, 2023	Model CompressionQuantization	CodeCode Available	1
Neural Network Compression using Binarization and Few Full-Precision Weights	Jun 15, 2023	BinarizationCPU	—Unverified	0
Evaluation and Optimization of Gradient Compression for Distributed Deep Learning	Jun 15, 2023	Deep LearningGPU	CodeCode Available	1
PUGAN: Physical Model-Guided Underwater Image Enhancement Using GAN with Dual-Discriminators	Jun 15, 2023	Image EnhancementQuantization	CodeCode Available	0
High-performance deep spiking neural networks with 0.3 spikes per neuron	Jun 14, 2023	image-classificationImage Classification	—Unverified	0
INT2.1: Towards Fine-Tunable Quantized Large Language Models with Error Correction through Low-Rank Adaptation	Jun 13, 2023	Language ModelingLanguage Modelling	CodeCode Available	4
GQFedWAvg: Optimization-Based Quantized Federated Learning in General Edge Computing Systems	Jun 13, 2023	Edge-computingFederated Learning	CodeCode Available	0
SqueezeLLM: Dense-and-Sparse Quantization	Jun 13, 2023	GPUQuantization	CodeCode Available	6
Discrete Graph Auto-Encoder	Jun 13, 2023	Graph GenerationQuantization	—Unverified	0
MFSN: Multi-perspective Fusion Search Network For Pre-training Knowledge in Speech Emotion Recognition	Jun 12, 2023	Emotion RecognitionQuantization	—Unverified	0
NF4 Isn't Information Theoretically Optimal (and that's Good)	Jun 12, 2023	Quantization	CodeCode Available	1
Sparse-Inductive Generative Adversarial Hashing for Nearest Neighbor Search	Jun 12, 2023	compressed sensingQuantization	—Unverified	0
Resource Efficient Neural Networks Using Hessian Based Pruning	Jun 12, 2023	GPUimage-classification	—Unverified	0
Efficient and Robust Quantization-aware Training via Adaptive Coreset Selection	Jun 12, 2023	Model CompressionQuantization	CodeCode Available	1
High-Fidelity Audio Compression with Improved RVQGAN	Jun 11, 2023	Audio CompressionAudio Generation	CodeCode Available	3
End-to-End Neural Network Compression via _1_2 Regularized Latency Surrogates	Jun 9, 2023	Neural Architecture SearchNeural Network Compression	—Unverified	0
Iterative Signal Processing for Integrated Sensing and Communication Systems	Jun 8, 2023	Integrated sensing and communicationISAC	—Unverified	0
Precision-aware Latency and Energy Balancing on Multi-Accelerator Platforms for DNN Inference	Jun 8, 2023	Quantization	—Unverified	0
Mixed-TD: Efficient Neural Network Accelerator with Layer-Specific Tensor Decomposition	Jun 8, 2023	Efficient Neural NetworkQuantization	CodeCode Available	0
Augmenting Hessians with Inter-Layer Dependencies for Mixed-Precision Post-Training Quantization	Jun 8, 2023	Quantization	—Unverified	0
MobileNMT: Enabling Translation in 15MB and 30ms	Jun 7, 2023	Model CompressionNMT	CodeCode Available	1
SpQR: A Sparse-Quantized Representation for Near-Lossless LLM Weight Compression	Jun 5, 2023	GPULanguage Modelling	CodeCode Available	2
Sensitivity-Aware Finetuning for Accuracy Recovery on Deep Learning Hardware	Jun 5, 2023	Deep LearningQuantization	—Unverified	0

Show:10 25 50

← PrevPage 87 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified