Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3501–3550 of 4925 papers

Title	Date	Tasks	Status	Hype
An Implementation of Vector Quantization using the Genetic Algorithm Approach	Feb 16, 2021	ArticlesBIG-bench Machine Learning	—Unverified	0
FAT: Learning Low-Bitwidth Parametric Representation via Frequency-Aware Transformation	Feb 15, 2021	Model CompressionNeural Network Compression	CodeCode Available	1
The Wavefunction of Continuous-Time Recurrent Neural Networks	Feb 13, 2021	Quantization	—Unverified	0
Confounding Tradeoffs for Neural Network Quantization	Feb 12, 2021	Quantization	CodeCode Available	1
The Distributed Discrete Gaussian Mechanism for Federated Learning with Secure Aggregation	Feb 12, 2021	Federated LearningQuantization	CodeCode Available	0
Visualizing hierarchies in scRNA-seq data using a density tree-biased autoencoder	Feb 11, 2021	Dimensionality ReductionQuantization	CodeCode Available	0
Group Quantization of Quadratic Hamiltonians in Finance	Feb 10, 2021	Quantization	—Unverified	0
BRECQ: Pushing the Limit of Post-Training Quantization by Block Reconstruction	Feb 10, 2021	image-classificationImage Classification	CodeCode Available	1
Distribution Adaptive INT8 Quantization for Training CNNs	Feb 9, 2021	image-classificationImage Classification	—Unverified	0
On the Universal Transformation of Data-Driven Models to Control Systems	Feb 9, 2021	Quantization	CodeCode Available	1
Sparsification via Compressed Sensing for Automatic Speech Recognition	Feb 9, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
Enabling Binary Neural Network Training on the Edge	Feb 8, 2021	Quantization	CodeCode Available	1
VS-Quant: Per-vector Scaled Quantization for Accurate Low-Precision Neural Network Inference	Feb 8, 2021	MathQuantization	—Unverified	0
Communication-efficient k-Means for Edge-based Machine Learning	Feb 8, 2021	BIG-bench Machine LearningDimensionality Reduction	—Unverified	0
Adaptive Quantization of Model Updates for Communication-Efficient Federated Learning	Feb 8, 2021	Federated LearningQuantization	—Unverified	0
Refining a -nearest neighbor graph for a computationally efficient spectral clustering	Feb 6, 2021	ClusteringComputational Efficiency	CodeCode Available	0
Symbolic Models for Infinite Networks of Control Systems: A Compositional Approach	Feb 5, 2021	Quantization	—Unverified	0
Compressed Object Detection	Feb 4, 2021	Model CompressionObject	CodeCode Available	0
Low Bit-Rate Wideband Speech Coding: A Deep Generative Model based Approach	Feb 4, 2021	Quantization	—Unverified	0
Progressive Neural Image Compression with Nested Quantization and Latent Ordering	Feb 4, 2021	Image CompressionQuantization	—Unverified	0
Fixed-point Quantization of Convolutional Neural Networks for Quantized Inference on Embedded Platforms	Feb 3, 2021	image-classificationImage Classification	CodeCode Available	1
Image Splicing Detection, Localization and Attribution via JPEG Primary Quantization Matrix Estimation and Clustering	Feb 2, 2021	ClusteringQuantization	—Unverified	0
FEDZIP: A Compression Framework for Communication-Efficient Federated Learning	Feb 2, 2021	BIG-bench Machine LearningClustering	CodeCode Available	0
Benchmarking Quantized Neural Networks on FPGAs with FINN	Feb 2, 2021	BenchmarkingQuantization	CodeCode Available	1
Probabilistic Learning Vector Quantization on Manifold of Symmetric Positive Definite Matrices	Feb 1, 2021	EEGElectroencephalogram (EEG)	—Unverified	0
Rescuing Deep Hashing from Dead Bits Problem	Feb 1, 2021	Deep HashingImage Retrieval	—Unverified	0
Understanding Cache Boundness of ML Operators on ARM Processors	Feb 1, 2021	Quantization	CodeCode Available	0
CAMBI: Contrast-aware Multiscale Banding Index	Jan 29, 2021	QuantizationSensitivity	—Unverified	0
Performance of Cell-Free MmWave Massive MIMO Systems with Fronthaul Compression and DAC Quantization	Jan 25, 2021	FairnessQuantization	—Unverified	0
AdderNet and its Minimalist Hardware Design for Energy-Efficient Artificial Intelligence	Jan 25, 2021	Quantization	—Unverified	0
Pruning and Quantization for Deep Neural Network Acceleration: A Survey	Jan 24, 2021	QuantizationSurvey	—Unverified	0
Error Diffusion Halftoning Against Adversarial Examples	Jan 23, 2021	Adversarial RobustnessQuantization	CodeCode Available	0
Continual Learning of Generative Models with Limited Data: From Wasserstein-1 Barycenter to Adaptive Coalescence	Jan 22, 2021	Continual LearningQuantization	—Unverified	0
Generative Zero-shot Network Quantization	Jan 21, 2021	Data Free QuantizationImage Generation	—Unverified	0
Overfitting for Fun and Profit: Instance-Adaptive Data Compression	Jan 21, 2021	Data CompressionImage Compression	—Unverified	0
Time-Correlated Sparsification for Communication-Efficient Federated Learning	Jan 21, 2021	Federated LearningQuantization	—Unverified	0
SparseDNN: Fast Sparse Deep Learning Inference on CPUs	Jan 20, 2021	Deep LearningQuantization	CodeCode Available	1
ES-ENAS: Efficient Evolutionary Optimization for Large Hybrid Search Spaces	Jan 19, 2021	Combinatorial OptimizationContinuous Control	CodeCode Available	0
Multi-Task Network Pruning and Embedded Optimization for Real-time Deployment in ADAS	Jan 19, 2021	Network Pruningobject-detection	—Unverified	0
Deep Compression of Neural Networks for Fault Detection on Tennessee Eastman Chemical Processes	Jan 18, 2021	ClusteringFault Detection	—Unverified	0
KDLSQ-BERT: A Quantized Bert Combining Knowledge Distillation with Learned Step Size Quantization	Jan 15, 2021	Knowledge DistillationLanguage Modelling	—Unverified	0
On the quantization of recurrent neural networks	Jan 14, 2021	CPUQuantization	—Unverified	0
FBGEMM: Enabling High-Performance Low-Precision Deep Learning Inference	Jan 13, 2021	Code GenerationDeep Learning	CodeCode Available	2
Energy-Efficient Distributed Learning Algorithms for Coarsely Quantized Signals	Jan 13, 2021	parameter estimationQuantization	—Unverified	0
Fast convolutional neural networks on FPGAs with hls4ml	Jan 13, 2021	Model CompressionQuantization	CodeCode Available	2
Towards Energy Efficient Federated Learning over 5G+ Mobile Devices	Jan 13, 2021	Federated LearningGPU	—Unverified	0
Single-path Bit Sharing for Automatic Loss-aware Model Compression	Jan 13, 2021	Model CompressionNetwork Pruning	—Unverified	0
Binary TTC: A Temporal Geofence for Autonomous Navigation	Jan 12, 2021	Autonomous NavigationQuantization	CodeCode Available	1
Sound Event Detection with Binary Neural Networks on Tightly Power-Constrained IoT Devices	Jan 12, 2021	Event DetectionObject Recognition	—Unverified	0
Activation Density based Mixed-Precision Quantization for Energy Efficient Neural Networks	Jan 12, 2021	Model CompressionQuantization	—Unverified	0

Show:10 25 50

← PrevPage 71 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified