Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3376–3400 of 4925 papers

Title	Date	Tasks	Status
Beyond Quantization: Power aware neural networks	Sep 29, 2021	Quantization	—Unverified
Toward Efficient Low-Precision Training: Data Format Optimization and Hysteresis Quantization	Sep 29, 2021	Quantization	—Unverified
Succinct Compression: Near-Optimal and Lossless Compression of Deep Neural Networks during Inference Runtime	Sep 29, 2021	Quantization	—Unverified
Contrastive Mutual Information Maximization for Binary Neural Networks	Sep 29, 2021	BinarizationContrastive Learning	—Unverified
Contrastive Quant: Quantization Makes Stronger Contrastive Learning	Sep 29, 2021	Contrastive LearningQuantization	—Unverified
PIVQGAN: Posture and Identity Disentangled Image-to-Image Translation via Vector Quantization	Sep 29, 2021	DisentanglementImage-to-Image Translation	—Unverified
CSQ: Centered Symmetric Quantization for Extremely Low Bit Neural Networks	Sep 29, 2021	Quantization	—Unverified
Specialized Transformers: Faster, Smaller and more Accurate NLP Models	Sep 29, 2021	Hard AttentionQuantization	—Unverified
Post-Training Quantization Is All You Need to Perform Cross-Platform Learned Image Compression	Sep 29, 2021	AllImage Compression	—Unverified
Lattice Quantization	Sep 29, 2021	Quantization	—Unverified
Delving into Channels: Exploring Hyperparameter Space of Channel Bit Widths with Linear Complexity	Sep 29, 2021	CPUQuantization	—Unverified
Differentiable Discrete Device-to-System Codesign for Optical Neural Networks via Gumbel-Softmax	Sep 29, 2021	QuantizationScheduling	—Unverified
Riemannian Manifold Embeddings for Straight-Through Estimator	Sep 29, 2021	Quantization	—Unverified
Revisiting Locality-Sensitive Binary Codes from Random Fourier Features	Sep 29, 2021	Information RetrievalQuantization	—Unverified
Efficient Point Transformer for Large-scale 3D Scene Understanding	Sep 29, 2021	3D Semantic SegmentationQuantization	—Unverified
HoloFormer: Deep Compression of Pre-Trained Transforms via Unified Optimization of N:M Sparsity and Integer Quantization	Sep 29, 2021	Quantization	—Unverified
Faster Neural Net Inference via Forests of Sparse Oblique Decision Trees	Sep 29, 2021	Quantization	—Unverified
Wavelet Feature Maps Compression for Low Bandwidth Convolutional Neural Networks	Sep 29, 2021	Depth EstimationDepth Prediction	—Unverified
Quantized sparse PCA for neural network weight compression	Sep 29, 2021	Quantization	—Unverified
Full-Precision Free Binary Graph Neural Networks	Sep 29, 2021	Graph Neural NetworkMixture-of-Experts	—Unverified
Click-through Rate Prediction with Auto-Quantized Contrastive Learning	Sep 27, 2021	Click-Through Rate PredictionContrastive Learning	—Unverified
Performance Analysis of IRS-Assisted Cell-Free Communication	Sep 26, 2021	Quantization	—Unverified
Communication-Efficient Federated Linear and Deep Generalized Canonical Correlation Analysis	Sep 25, 2021	Distributed ComputingDistributed Optimization	CodeCode Available
Distribution-sensitive Information Retention for Accurate Binary Neural Network	Sep 25, 2021	Binarizationimage-classification	—Unverified
Predicting Attention Sparsity in Transformers	Sep 24, 2021	DecoderLanguage Modeling	—Unverified

Show:10 25 50

← PrevPage 136 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified