Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3901–3950 of 4925 papers

Title	Date	Tasks	Status	Hype
Lite Transformer with Long-Short Range Attention	Apr 24, 2020	Abstractive Text SummarizationAutoML	CodeCode Available	1
QUANOS- Adversarial Noise Sensitivity Driven Hybrid Quantization of Neural Networks	Apr 22, 2020	Adversarial RobustnessQuantization	—Unverified	0
Up or Down? Adaptive Rounding for Post-Training Quantization	Apr 22, 2020	Quantization	—Unverified	0
A Data and Compute Efficient Design for Limited-Resources Deep Learning	Apr 21, 2020	Deep LearningQuantization	—Unverified	0
Integer Quantization for Deep Learning Inference: Principles and Empirical Evaluation	Apr 20, 2020	Deep LearningMath	CodeCode Available	0
LSQ+: Improving low-bit quantization through learnable offsets and better initialization	Apr 20, 2020	Image ClassificationQuantization	CodeCode Available	1
HCM: Hardware-Aware Complexity Metric for Neural Network Architectures	Apr 19, 2020	Quantizationspeech-recognition	—Unverified	0
Quantization Guided JPEG Artifact Correction	Apr 17, 2020	Image CompressionJPEG Artifact Correction	CodeCode Available	0
Single upper limb pose estimation method based on improved stacked hourglass network	Apr 16, 2020	Pose EstimationQuantization	—Unverified	0
Deep Neural Network for Respiratory Sound Classification in Wearable Devices Enabled by Patient Specific Model Tuning	Apr 16, 2020	Anomaly DetectionGeneral Classification	CodeCode Available	0
Q-CapsNets: A Specialized Framework for Quantizing Capsule Networks	Apr 15, 2020	image-classificationImage Classification	—Unverified	0
Breaking the waves: asymmetric random periodic features for low-bitrate kernel machines	Apr 14, 2020	Quantization	—Unverified	0
Technical Report: NEMO DNN Quantization for Deployment Model	Apr 13, 2020	Quantization	CodeCode Available	1
Minimizing FLOPs to Learn Efficient Sparse Representations	Apr 12, 2020	QuantizationRepresentation Learning	CodeCode Available	1
Depthwise Discrete Representation Learning	Apr 11, 2020	QuantizationRepresentation Learning	CodeCode Available	0
Exposing Hardware Building Blocks to Machine Learning Frameworks	Apr 10, 2020	BIG-bench Machine LearningQuantization	—Unverified	0
Dithered backprop: A sparse and quantized backpropagation algorithm for more efficient deep neural network training	Apr 9, 2020	image-classificationImage Classification	—Unverified	0
Deep Attentive Generative Adversarial Network for Photo-Realistic Image De-Quantization	Apr 7, 2020	Generative Adversarial NetworkQuantization	—Unverified	0
Unsupervised Person Re-identification via Softened Similarity Learning	Apr 7, 2020	ClusteringGeneral Classification	CodeCode Available	0
CNN2Gate: Toward Designing a General Framework for Implementation of Convolutional Neural Networks on FPGA	Apr 6, 2020	QuantizationReinforcement Learning	—Unverified	0
LogicNets: Co-Designed Neural Networks and Circuits for Extreme-Throughput Applications	Apr 6, 2020	Intrusion DetectionNetwork Intrusion Detection	CodeCode Available	1
Attentive One-Dimensional Heatmap Regression for Facial Landmark Detection and Tracking	Apr 5, 2020	Face AlignmentFacial Landmark Detection	—Unverified	0
Feature Quantization Improves GAN Training	Apr 5, 2020	Conditional Image GenerationFace Generation	CodeCode Available	1
Distributed Inference with Sparse and Quantized Communication	Apr 2, 2020	Quantization	—Unverified	0
Single-Image HDR Reconstruction by Learning to Reverse the Camera Pipeline	Apr 2, 2020	HDR Reconstructioninverse tone mapping	CodeCode Available	1
A Modular Neural Network Based Deep Learning Approach for MIMO Signal Detection	Apr 1, 2020	Quantization	—Unverified	0
Binary Neural Networks: A Survey	Mar 31, 2020	Binarizationimage-classification	CodeCode Available	2
Improved Gradient based Adversarial Attacks for Quantized Networks	Mar 30, 2020	image-classificationImage Classification	CodeCode Available	0
Deep Learning for Radio Resource Allocation with Diverse Quality-of-Service Requirements in 5G	Mar 29, 2020	QuantizationTransfer Learning	—Unverified	0
Event-Triggered Quantized Average Consensus via Mass Summation	Mar 27, 2020	Quantization	—Unverified	0
A Short Note on Analyzing Sequence Complexity in Trajectory Prediction Benchmarks	Mar 27, 2020	QuantizationTrajectory Prediction	—Unverified	0
Acceleration of Convolutional Neural Network Using FFT-Based Split Convolutions	Mar 27, 2020	Quantization	—Unverified	0
Multi-Feature Discrete Collaborative Filtering for Fast Cold-start Recommendation	Mar 24, 2020	Collaborative FilteringQuantization	—Unverified	0
A Survey of Methods for Low-Power Deep Learning and Computer Vision	Mar 24, 2020	Knowledge DistillationQuantization	—Unverified	0
Tree Index: A New Cluster Evaluation Technique	Mar 24, 2020	ClusteringQuantization	—Unverified	0
Multi-target regression via output space quantization	Mar 22, 2020	Computational EfficiencyMulti-target regression	—Unverified	0
DP-Net: Dynamic Programming Guided Deep Neural Network Compression	Mar 21, 2020	ClusteringNeural Network Compression	—Unverified	0
FTT-NAS: Discovering Fault-Tolerant Convolutional Neural Architecture	Mar 20, 2020	Neural Architecture SearchQuantization	CodeCode Available	0
LANCE: Efficient Low-Precision Quantized Winograd Convolution for Neural Networks Based on Graphics Processing Units	Mar 19, 2020	image-classificationImage Classification	—Unverified	0
Learning to Structure an Image with Few Colors	Mar 17, 2020	Explainable artificial intelligenceImage Compression	CodeCode Available	1
Efficient Bitwidth Search for Practical Mixed Precision Neural Network	Mar 17, 2020	Quantization	—Unverified	0
RCNet: Incorporating Structural Information into Deep RNN for MIMO-OFDM Symbol Detection with Limited Training	Mar 15, 2020	Quantization	—Unverified	0
DNN+NeuroSim V2.0: An End-to-End Benchmarking Framework for Compute-in-Memory Accelerators for On-chip Training	Mar 13, 2020	BenchmarkingQuantization	CodeCode Available	1
LCP: A Low-Communication Parallelization Method for Fast Neural Network Inference in Image Recognition	Mar 13, 2020	Quantization	—Unverified	0
Fast Distance-based Anomaly Detection in Images Using an Inception-like Autoencoder	Mar 12, 2020	Anomaly DetectionQuantization	CodeCode Available	1
Kernel Quantization for Efficient Network Compression	Mar 11, 2020	Quantization	—Unverified	0
Communication-efficient Variance-reduced Stochastic Gradient Descent	Mar 10, 2020	Distributed OptimizationQuantization	—Unverified	0
Distributed Deep Convolutional Compression for Massive MIMO CSI Feedback	Mar 7, 2020	Quantization	—Unverified	0
Generative Low-bitwidth Data Free Quantization	Mar 7, 2020	Data Free QuantizationQuantization	CodeCode Available	1
Ternary Compression for Communication-Efficient Federated Learning	Mar 7, 2020	BIG-bench Machine LearningFederated Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 79 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified