Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3301–3350 of 4925 papers

Title	Date	Tasks	Status
Optimization of Quantized Phase Shifts for Reconfigurable Smart Surfaces Assisted Communications	Nov 19, 2021	Quantization	—Unverified
Toward Compact Parameter Representations for Architecture-Agnostic Neural Network Compression	Nov 19, 2021	Neural Network CompressionQuantization	—Unverified
End-to-End Learned Image Compression with Quantized Weights and Activations	Nov 17, 2021	Image CompressionMS-SSIM	—Unverified
Low Precision Decentralized Distributed Training over IID and non-IID Data	Nov 17, 2021	Quantization	CodeCode Available
Reconstruction-Computation-Quantization (RCQ): A Paradigm for Low Bit Width LDPC Decoding	Nov 17, 2021	DecoderQuantization	—Unverified
Online Meta Adaptation for Variable-Rate Learned Image Compression	Nov 16, 2021	DecoderImage Compression	—Unverified
VQN: Variable Quantization Noise for Neural Network Compression	Nov 16, 2021	Neural Network CompressionQuantization	—Unverified
Compact Token Representations with Contextual Quantization for Efficient Document Re-ranking	Nov 16, 2021	QuantizationRe-Ranking	—Unverified
Wyner-Ziv Gradient Compression for Federated Learning	Nov 16, 2021	Federated LearningQuantization	—Unverified
Predicting Attention Sparsity in Transformers	Nov 16, 2021	DecoderLanguage Modeling	—Unverified
On the Tradeoff between Energy, Precision, and Accuracy in Federated Quantized Neural Networks	Nov 15, 2021	Federated LearningQuantization	—Unverified
Machine Learning for CSI Recreation Based on Prior Knowledge	Nov 15, 2021	BIG-bench Machine LearningQuantization	—Unverified
Energy Efficient Learning with Low Resolution Stochastic Domain Wall Synapse Based Deep Neural Networks	Nov 14, 2021	Quantization	—Unverified
Iterative Training: Finding Binary Weight Deep Neural Networks with Layer Binarization	Nov 13, 2021	BinarizationQuantization	CodeCode Available
A Robust Deep Learning-Based Beamforming Design for RIS-assisted Multiuser MISO Communications with Practical Constraints	Nov 12, 2021	Quantization	—Unverified
Domain Generalization on Efficient Acoustic Scene Classification using Residual Normalization	Nov 12, 2021	Acoustic Scene ClassificationClassification	—Unverified
Q-Learning for MDPs with General Spaces: Convergence and Near Optimality via Quantization under Weak Continuity	Nov 12, 2021	Q-LearningQuantization	—Unverified
Solving Multi-Arm Bandit Using a Few Bits of Communication	Nov 11, 2021	Active LearningQuantization	—Unverified
Variability-Aware Training and Self-Tuning of Highly Quantized DNNs for Analog PIM	Nov 11, 2021	Quantization	—Unverified
An Underexplored Dilemma between Confidence and Calibration in Quantized Neural Networks	Nov 10, 2021	Decision MakingQuantization	CodeCode Available
Prune Once for All: Sparse Pre-Trained Language Models	Nov 10, 2021	AllNatural Language Inference	—Unverified
Entropy optimized semi-supervised decomposed vector-quantized variational autoencoder model based on transfer learning for multiclass text classification and generation	Nov 10, 2021	DecoderMulti Class Text Classification	—Unverified
Graph-Based Depth Denoising & Dequantization for Point Cloud Enhancement	Nov 9, 2021	DenoisingGraph Learning	—Unverified
Learning from Multiple Time Series: A Deep Disentangled Approach to Diversified Time Series Forecasting	Nov 9, 2021	DecoderQuantization	—Unverified
Differential Modulation in Massive MIMO With Low-Resolution ADCs	Nov 9, 2021	Quantization	—Unverified
ML-EXray: Visibility into ML Deployment on the Edge	Nov 8, 2021	Quantization	—Unverified
Rethinking Deconvolution for 2D Human Pose Estimation Light yet Accurate Model for Real-time Edge Computing	Nov 8, 2021	2D Human Pose EstimationDecoder	—Unverified
LW-GCN: A Lightweight FPGA-based Graph Convolutional Network Accelerator	Nov 4, 2021	CPUGPU	—Unverified
Constructing High-Order Signed Distance Maps from Computed Tomography Data with Application to Bone Morphometry	Nov 2, 2021	Quantization	—Unverified
Simple and Effective Unsupervised Redundancy Elimination to Compress Dense Vectors for Passage Retrieval	Nov 1, 2021	Open-Domain Question AnsweringPassage Retrieval	—Unverified
Structure Information is the Key: Self-Attention RoI Feature Extractor in 3D Object Detection	Nov 1, 2021	2D Object Detection3D Object Detection	—Unverified
HW-TSC’s Participation in the WMT 2021 Efficiency Shared Task	Nov 1, 2021	CPUDecoder	—Unverified
PP-ShiTu: A Practical Lightweight Image Recognition System	Nov 1, 2021	Face RecognitionKnowledge Distillation	CodeCode Available
Efficient Machine Translation with Model Pruning and Quantization	Nov 1, 2021	CPUDecoder	—Unverified
Revealing and Protecting Labels in Distributed Training	Oct 31, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available
Reconfigurable Intelligent Surface-induced Randomness for mmWave Key Generation	Oct 31, 2021	Quantization	—Unverified
DAdaQuant: Doubly-adaptive quantization for communication-efficient Federated Learning	Oct 31, 2021	Federated LearningPrivacy Preserving	—Unverified
ILMPQ : An Intra-Layer Multi-Precision Deep Neural Network Quantization framework for FPGA	Oct 30, 2021	Edge-computingModel Compression	—Unverified
RMSMP: A Novel Deep Neural Network Quantization Framework with Row-wise Mixed Schemes and Multiple Precisions	Oct 30, 2021	image-classificationImage Classification	—Unverified
Nash equilibrium of multi-agent graphical game with a privacy information encrypted learning algorithm	Oct 29, 2021	Quantization	—Unverified
FAST: DNN Training Under Variable Precision Block Floating Point with Stochastic Rounding	Oct 28, 2021	Quantization	—Unverified
MERCURY: Accelerating DNN Training By Exploiting Input Similarity	Oct 28, 2021	Quantization	—Unverified
Differential Deep Detection in Massive MIMO With One-Bit ADC	Oct 27, 2021	Quantization	—Unverified
High-Order Signed Distance Transform of Sampled Signals	Oct 26, 2021	QuantizationUnity	—Unverified
Algorithms for the Communication of Samples	Oct 25, 2021	Quantization	—Unverified
Demystifying and Generalizing BinaryConnect	Oct 25, 2021	Quantization	—Unverified
Deep Asymmetric Hashing with Dual Semantic Regression and Class Structure Quantization	Oct 24, 2021	Deep HashingImage Retrieval	—Unverified
Task-Based Graph Signal Compression	Oct 24, 2021	Quantization	CodeCode Available
A Layer-wise Adversarial-aware Quantization Optimization for Improving Robustness	Oct 23, 2021	Quantization	—Unverified
Vis-TOP: Visual Transformer Overlay Processor	Oct 21, 2021	CPUGPU	—Unverified

Show:10 25 50

← PrevPage 67 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified