Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2776–2800 of 4925 papers

Title	Date	Tasks	Status	Hype
Channel-wise Mixed-precision Assignment for DNN Inference on Constrained Edge Nodes	Jun 17, 2022	Neural Architecture SearchQuantization	CodeCode Available	0
Lossy Compression with Gaussian Diffusion	Jun 17, 2022	Quantization	CodeCode Available	1
Fast Lossless Neural Compression with Integer-Only Discrete Flows	Jun 17, 2022	Quantization	CodeCode Available	1
tinySNN: Towards Memory- and Energy-Efficient Spiking Neural Networks	Jun 17, 2022	Quantization	—Unverified	0
Accelerating Inference and Language Model Fusion of Recurrent Neural Network Transducers via End-to-End 4-bit Quantization	Jun 16, 2022	Language ModelingLanguage Modelling	—Unverified	0
PeQuENet: Perceptual Quality Enhancement of Compressed Video with Adaptation- and Attention-based Network	Jun 16, 2022	Generative Adversarial NetworkQuantization	CodeCode Available	1
Compressed-VFL: Communication-Efficient Learning with Vertically Partitioned Data	Jun 16, 2022	Federated LearningQuantization	—Unverified	0
Hardening DNNs against Transfer Attacks during Network Compression using Greedy Adversarial Pruning	Jun 15, 2022	Adversarial RobustnessQuantization	CodeCode Available	0
Edge Inference with Fully Differentiable Quantized Mixed Precision Neural Networks	Jun 15, 2022	Edge-computingQuantization	—Unverified	0
QONNX: Representing Arbitrary-Precision Quantized Neural Networks	Jun 15, 2022	Quantization	CodeCode Available	1
Federated Optimization Algorithms with Random Reshuffling and Gradient Compression	Jun 14, 2022	Federated LearningQuantization	CodeCode Available	1
Towards Alternative Techniques for Improving Adversarial Robustness: Analysis of Adversarial Training at a Spectrum of Perturbations	Jun 13, 2022	Adversarial RobustnessQuantization	CodeCode Available	0
Optimal Clipping and Magnitude-aware Differentiation for Improved Quantization-aware Training	Jun 13, 2022	Quantization	CodeCode Available	0
Why Quantization Improves Generalization: NTK of Binary Weight Neural Networks	Jun 13, 2022	Quantization	—Unverified	0
Preprocessing Enhanced Image Compression for Machine Vision	Jun 12, 2022	Image Compressionobject-detection	—Unverified	0
A Directed-Evolution Method for Sparsification and Compression of Neural Networks with Application to Object Identification and Segmentation and considerations of optimal quantization using small number of bits	Jun 12, 2022	Quantization	—Unverified	0
Convex Quantization Preserves Logconcavity	Jun 11, 2022	Quantization	—Unverified	0
Real-time Hyper-Dimensional Reconfiguration at the Edge using Hardware Accelerators	Jun 10, 2022	Few-Shot LearningQuantization	—Unverified	0
SDQ: Stochastic Differentiable Quantization with Mixed Precision	Jun 9, 2022	Knowledge DistillationNeural Architecture Search	—Unverified	0
HideNseek: Federated Lottery Ticket via Server-side Pruning and Sign Supermask	Jun 9, 2022	Federated LearningModel Compression	—Unverified	0
Memory-Oriented Design-Space Exploration of Edge-AI Hardware for XR Applications	Jun 8, 2022	CPUHand Detection	—Unverified	0
Gradient Obfuscation Gives a False Sense of Security in Federated Learning	Jun 8, 2022	Federated Learningimage-classification	—Unverified	0
Low-complexity acoustic scene classification in DCASE 2022 Challenge	Jun 8, 2022	Acoustic Scene ClassificationClassification	—Unverified	0
Enhancing Strong PUF Security with Non-monotonic Response Quantization	Jun 7, 2022	Quantization	—Unverified	0
Learning Binarized Graph Representations with Multi-faceted Quantization Reinforcement for Top-K Recommendation	Jun 5, 2022	BinarizationInformativeness	—Unverified	0

Show:10 25 50

← PrevPage 112 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified