Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3651–3700 of 4925 papers

Title	Date	Tasks	Status
FEDZIP: A Compression Framework for Communication-Efficient Federated Learning	Feb 2, 2021	BIG-bench Machine LearningClustering	CodeCode Available
Image Splicing Detection, Localization and Attribution via JPEG Primary Quantization Matrix Estimation and Clustering	Feb 2, 2021	ClusteringQuantization	—Unverified
Probabilistic Learning Vector Quantization on Manifold of Symmetric Positive Definite Matrices	Feb 1, 2021	EEGElectroencephalogram (EEG)	—Unverified
Rescuing Deep Hashing from Dead Bits Problem	Feb 1, 2021	Deep HashingImage Retrieval	—Unverified
Understanding Cache Boundness of ML Operators on ARM Processors	Feb 1, 2021	Quantization	CodeCode Available
CAMBI: Contrast-aware Multiscale Banding Index	Jan 29, 2021	QuantizationSensitivity	—Unverified
Performance of Cell-Free MmWave Massive MIMO Systems with Fronthaul Compression and DAC Quantization	Jan 25, 2021	FairnessQuantization	—Unverified
AdderNet and its Minimalist Hardware Design for Energy-Efficient Artificial Intelligence	Jan 25, 2021	Quantization	—Unverified
Pruning and Quantization for Deep Neural Network Acceleration: A Survey	Jan 24, 2021	QuantizationSurvey	—Unverified
Error Diffusion Halftoning Against Adversarial Examples	Jan 23, 2021	Adversarial RobustnessQuantization	CodeCode Available
Continual Learning of Generative Models with Limited Data: From Wasserstein-1 Barycenter to Adaptive Coalescence	Jan 22, 2021	Continual LearningQuantization	—Unverified
Overfitting for Fun and Profit: Instance-Adaptive Data Compression	Jan 21, 2021	Data CompressionImage Compression	—Unverified
Generative Zero-shot Network Quantization	Jan 21, 2021	Data Free QuantizationImage Generation	—Unverified
Time-Correlated Sparsification for Communication-Efficient Federated Learning	Jan 21, 2021	Federated LearningQuantization	—Unverified
ES-ENAS: Efficient Evolutionary Optimization for Large Hybrid Search Spaces	Jan 19, 2021	Combinatorial OptimizationContinuous Control	CodeCode Available
Multi-Task Network Pruning and Embedded Optimization for Real-time Deployment in ADAS	Jan 19, 2021	Network Pruningobject-detection	—Unverified
Deep Compression of Neural Networks for Fault Detection on Tennessee Eastman Chemical Processes	Jan 18, 2021	ClusteringFault Detection	—Unverified
KDLSQ-BERT: A Quantized Bert Combining Knowledge Distillation with Learned Step Size Quantization	Jan 15, 2021	Knowledge DistillationLanguage Modelling	—Unverified
On the quantization of recurrent neural networks	Jan 14, 2021	CPUQuantization	—Unverified
Towards Energy Efficient Federated Learning over 5G+ Mobile Devices	Jan 13, 2021	Federated LearningGPU	—Unverified
Single-path Bit Sharing for Automatic Loss-aware Model Compression	Jan 13, 2021	Model CompressionNetwork Pruning	—Unverified
Energy-Efficient Distributed Learning Algorithms for Coarsely Quantized Signals	Jan 13, 2021	parameter estimationQuantization	—Unverified
Activation Density based Mixed-Precision Quantization for Energy Efficient Neural Networks	Jan 12, 2021	Model CompressionQuantization	—Unverified
Sound Event Detection with Binary Neural Networks on Tightly Power-Constrained IoT Devices	Jan 12, 2021	Event DetectionObject Recognition	—Unverified
Computational data analysis for first quantization estimation on JPEG double compressed images	Jan 10, 2021	Quantization	CodeCode Available
Quantization optimized with respect to the Haar basis	Jan 9, 2021	Quantization	—Unverified
Who's a Good Boy? Reinforcing Canine Behavior in Real-Time using Machine Learning	Jan 7, 2021	BIG-bench Machine Learningimage-classification	CodeCode Available
Noise Sensitivity-Based Energy Efficient and Robust Adversary Detection in Neural Networks	Jan 5, 2021	QuantizationSensitivity	—Unverified
End-to-end Quantized Training via Log-Barrier Extensions	Jan 1, 2021	Quantization	—Unverified
Product Quantizer Aware Inverted Index for Scalable Nearest Neighbor Search	Jan 1, 2021	Quantization	—Unverified
Practical Locally Private Federated Learning with Communication Efficiency	Jan 1, 2021	Federated LearningPrivacy Preserving	—Unverified
Uniform-Precision Neural Network Quantization via Neural Channel Expansion	Jan 1, 2021	Neural Architecture SearchQuantization	—Unverified
Incremental few-shot learning via vector quantization in deep embedded space	Jan 1, 2021	class-incremental learningClass Incremental Learning	—Unverified
Improving Low-Precision Network Quantization via Bin Regularization	Jan 1, 2021	Quantization	—Unverified
TwinDNN: A Tale of Two Deep Neural Networks	Jan 1, 2021	image-classificationImage Classification	—Unverified
Explore the Potential of CNN Low Bit Training	Jan 1, 2021	Quantization	—Unverified
DQSGD: DYNAMIC QUANTIZED STOCHASTIC GRADIENT DESCENT FOR COMMUNICATION-EFFICIENT DISTRIBUTED LEARNING	Jan 1, 2021	Quantization	—Unverified
Simple Augmentation Goes a Long Way: ADRL for DNN Quantization	Jan 1, 2021	Deep Reinforcement LearningQuantization	—Unverified
Improving the accuracy of neural networks in analog computing-in-memory systems by a generalized quantization method	Jan 1, 2021	image-classificationImage Classification	—Unverified
Post-Training Weighted Quantization of Neural Networks for Language Models	Jan 1, 2021	Model CompressionQuantization	—Unverified
Collaborative Filtering with Smooth Reconstruction of the Preference Function	Jan 1, 2021	Collaborative FilteringQuantization	—Unverified
Semi-Relaxed Quantization with DropBits: Training Low-Bit Neural Networks via Bitwise Regularization	Jan 1, 2021	Quantization	—Unverified
WrapNet: Neural Net Inference with Ultra-Low-Precision Arithmetic	Jan 1, 2021	Quantization	—Unverified
WAVEQ: GRADIENT-BASED DEEP QUANTIZATION OF NEURAL NETWORKS THROUGH SINUSOIDAL REGULARIZATION	Jan 1, 2021	Quantization	CodeCode Available
Hybrid and Non-Uniform DNN quantization methods using Retro Synthesis data for efficient inference	Jan 1, 2021	Quantization	—Unverified
Multi-Prize Lottery Ticket Hypothesis: Finding Generalizable and Efficient Binary Subnetworks in a Randomly Weighted Neural Network	Jan 1, 2021	Quantization	—Unverified
Weights Having Stable Signs Are Important: Finding Primary Subnetworks and Kernels to Compress Binary Weight Networks	Jan 1, 2021	Quantization	—Unverified
Learned Multi-Resolution Variable-Rate Image Compression with Octave-based Residual Blocks	Dec 31, 2020	DecoderImage Compression	—Unverified
BinaryBERT: Pushing the Limit of BERT Quantization	Dec 31, 2020	BinarizationModel Compression	—Unverified
Improving Adversarial Robustness in Weight-quantized Neural Networks	Dec 29, 2020	Adversarial RobustnessQuantization	—Unverified

Show:10 25 50

← PrevPage 74 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified