Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3051–3100 of 4925 papers

Title	Date	Tasks	Status
Asymmetric Learned Image Compression with Multi-Scale Residual Block, Importance Map, and Post-Quantization Filtering	Jun 21, 2022	DecoderImage Compression	—Unverified
Self-Supervised Consistent Quantization for Fully Unsupervised Image Retrieval	Jun 20, 2022	Contrastive LearningImage Retrieval	—Unverified
Low-Precision Stochastic Gradient Langevin Dynamics	Jun 20, 2022	Deep LearningQuantization	CodeCode Available
Channel-wise Mixed-precision Assignment for DNN Inference on Constrained Edge Nodes	Jun 17, 2022	Neural Architecture SearchQuantization	CodeCode Available
Towards Efficient Active Learning of PDFA	Jun 17, 2022	Active LearningQuantization	CodeCode Available
tinySNN: Towards Memory- and Energy-Efficient Spiking Neural Networks	Jun 17, 2022	Quantization	—Unverified
Accelerating Inference and Language Model Fusion of Recurrent Neural Network Transducers via End-to-End 4-bit Quantization	Jun 16, 2022	Language ModelingLanguage Modelling	—Unverified
Compressed-VFL: Communication-Efficient Learning with Vertically Partitioned Data	Jun 16, 2022	Federated LearningQuantization	—Unverified
Edge Inference with Fully Differentiable Quantized Mixed Precision Neural Networks	Jun 15, 2022	Edge-computingQuantization	—Unverified
Hardening DNNs against Transfer Attacks during Network Compression using Greedy Adversarial Pruning	Jun 15, 2022	Adversarial RobustnessQuantization	CodeCode Available
Towards Alternative Techniques for Improving Adversarial Robustness: Analysis of Adversarial Training at a Spectrum of Perturbations	Jun 13, 2022	Adversarial RobustnessQuantization	CodeCode Available
Why Quantization Improves Generalization: NTK of Binary Weight Neural Networks	Jun 13, 2022	Quantization	—Unverified
Optimal Clipping and Magnitude-aware Differentiation for Improved Quantization-aware Training	Jun 13, 2022	Quantization	CodeCode Available
Preprocessing Enhanced Image Compression for Machine Vision	Jun 12, 2022	Image Compressionobject-detection	—Unverified
A Directed-Evolution Method for Sparsification and Compression of Neural Networks with Application to Object Identification and Segmentation and considerations of optimal quantization using small number of bits	Jun 12, 2022	Quantization	—Unverified
Convex Quantization Preserves Logconcavity	Jun 11, 2022	Quantization	—Unverified
Real-time Hyper-Dimensional Reconfiguration at the Edge using Hardware Accelerators	Jun 10, 2022	Few-Shot LearningQuantization	—Unverified
HideNseek: Federated Lottery Ticket via Server-side Pruning and Sign Supermask	Jun 9, 2022	Federated LearningModel Compression	—Unverified
SDQ: Stochastic Differentiable Quantization with Mixed Precision	Jun 9, 2022	Knowledge DistillationNeural Architecture Search	—Unverified
Memory-Oriented Design-Space Exploration of Edge-AI Hardware for XR Applications	Jun 8, 2022	CPUHand Detection	—Unverified
Low-complexity acoustic scene classification in DCASE 2022 Challenge	Jun 8, 2022	Acoustic Scene ClassificationClassification	—Unverified
Gradient Obfuscation Gives a False Sense of Security in Federated Learning	Jun 8, 2022	Federated Learningimage-classification	—Unverified
Enhancing Strong PUF Security with Non-monotonic Response Quantization	Jun 7, 2022	Quantization	—Unverified
Learning Binarized Graph Representations with Multi-faceted Quantization Reinforcement for Top-K Recommendation	Jun 5, 2022	BinarizationInformativeness	—Unverified
Extreme Compression for Pre-trained Transformers Made Simple and Efficient	Jun 4, 2022	Knowledge DistillationQuantization	—Unverified
Completion Time Minimization of Fog-RAN-Assisted Federated Learning With Rate-Splitting Transmission	Jun 3, 2022	Federated LearningQuantization	—Unverified
Resource Allocation for Compression-aided Federated Learning with High Distortion Rate	Jun 2, 2022	Federated LearningModel Compression	—Unverified
Long Scale Error Control in Low Light Image and Video Enhancement Using Equivariance	Jun 2, 2022	QuantizationVideo Enhancement	—Unverified
On the Role of Spatial Effects in Early Estimates of Disease Infectiousness: A Second Quantization Approach	May 31, 2022	Quantization	—Unverified
AMED: Automatic Mixed-Precision Quantization for Edge Devices	May 30, 2022	Quantization	CodeCode Available
Q-LIC: Quantizing Learned Image Compression with Channel Splitting	May 28, 2022	Image CompressionMS-SSIM	—Unverified
Efficient-Adam: Communication-Efficient Distributed Adam	May 28, 2022	Quantization	—Unverified
FCN-Pose: A Pruned and Quantized CNN for Robot Pose Estimation for Constrained Devices	May 26, 2022	Pose EstimationQuantization	—Unverified
QUIC-FL: Quick Unbiased Compression for Federated Learning	May 26, 2022	Federated LearningQuantization	—Unverified
Federated Split BERT for Heterogeneous Text Classification	May 26, 2022	ClassificationFederated Learning	—Unverified
Sparse*BERT: Sparse Models Generalize To New tasks and Domains	May 25, 2022	Quantization	—Unverified
A Low Memory Footprint Quantized Neural Network for Depth Completion of Very Sparse Time-of-Flight Depth Maps	May 25, 2022	DecoderDepth Completion	—Unverified
Train Flat, Then Compress: Sharpness-Aware Minimization Learns More Compressible Models	May 25, 2022	Model CompressionQuantization	—Unverified
Approximation speed of quantized vs. unquantized ReLU neural networks and beyond	May 24, 2022	Quantization	—Unverified
Few-bit Quantization of Neural Networks for Nonlinearity Mitigation in a Fiber Transmission Experiment	May 23, 2022	Quantization	—Unverified
OPQ: Compressing Deep Neural Networks with One-shot Pruning-Quantization	May 23, 2022	Quantization	—Unverified
Nonparametric Decentralized Detection and Sparse Sensor Selection via Multi-Sensor Online Kernel Scalar Quantization	May 21, 2022	ClassificationQuantization	—Unverified
Approximate Message Passing with Parameter Estimation for Heavily Quantized Measurements	May 20, 2022	Computational Efficiencyparameter estimation	CodeCode Available
QADAM: Quantization-Aware DNN Accelerator Modeling for Pareto-Optimality	May 20, 2022	Quantization	—Unverified
Energy-efficient Deployment of Deep Learning Applications on Cortex-M based Microcontrollers using Deep Compression	May 20, 2022	Quantization	—Unverified
Service Delay Minimization for Federated Learning over Mobile Devices	May 19, 2022	Federated LearningQuantization	—Unverified
Positional Information is All You Need: A Novel Pipeline for Self-Supervised SVDE from Videos	May 18, 2022	AllDepth Estimation	—Unverified
A Silicon Photonic Accelerator for Convolutional Neural Networks with Heterogeneous Quantization	May 17, 2022	Quantization	—Unverified
Towards Robust Low Light Image Enhancement	May 17, 2022	Image EnhancementLow-Light Image Enhancement	—Unverified
QAPPA: Quantization-Aware Power, Performance, and Area Modeling of DNN Accelerators	May 17, 2022	Model CompressionQuantization	—Unverified

Show:10 25 50

← PrevPage 62 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified