Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3101–3150 of 4925 papers

Title	Date	Tasks	Status	Hype
Predicting Attention Sparsity in Transformers	Nov 16, 2021	DecoderLanguage Modeling	—Unverified	0
Wyner-Ziv Gradient Compression for Federated Learning	Nov 16, 2021	Federated LearningQuantization	—Unverified	0
Online Meta Adaptation for Variable-Rate Learned Image Compression	Nov 16, 2021	DecoderImage Compression	—Unverified	0
Machine Learning for CSI Recreation Based on Prior Knowledge	Nov 15, 2021	BIG-bench Machine LearningQuantization	—Unverified	0
On the Tradeoff between Energy, Precision, and Accuracy in Federated Quantized Neural Networks	Nov 15, 2021	Federated LearningQuantization	—Unverified	0
Energy Efficient Learning with Low Resolution Stochastic Domain Wall Synapse Based Deep Neural Networks	Nov 14, 2021	Quantization	—Unverified	0
Iterative Training: Finding Binary Weight Deep Neural Networks with Layer Binarization	Nov 13, 2021	BinarizationQuantization	CodeCode Available	0
Domain Generalization on Efficient Acoustic Scene Classification using Residual Normalization	Nov 12, 2021	Acoustic Scene ClassificationClassification	—Unverified	0
Q-Learning for MDPs with General Spaces: Convergence and Near Optimality via Quantization under Weak Continuity	Nov 12, 2021	Q-LearningQuantization	—Unverified	0
A Robust Deep Learning-Based Beamforming Design for RIS-assisted Multiuser MISO Communications with Practical Constraints	Nov 12, 2021	Quantization	—Unverified	0
Variability-Aware Training and Self-Tuning of Highly Quantized DNNs for Analog PIM	Nov 11, 2021	Quantization	—Unverified	0
Solving Multi-Arm Bandit Using a Few Bits of Communication	Nov 11, 2021	Active LearningQuantization	—Unverified	0
An Underexplored Dilemma between Confidence and Calibration in Quantized Neural Networks	Nov 10, 2021	Decision MakingQuantization	CodeCode Available	0
Entropy optimized semi-supervised decomposed vector-quantized variational autoencoder model based on transfer learning for multiclass text classification and generation	Nov 10, 2021	DecoderMulti Class Text Classification	—Unverified	0
Prune Once for All: Sparse Pre-Trained Language Models	Nov 10, 2021	AllNatural Language Inference	—Unverified	0
Graph-Based Depth Denoising & Dequantization for Point Cloud Enhancement	Nov 9, 2021	DenoisingGraph Learning	—Unverified	0
Learning from Multiple Time Series: A Deep Disentangled Approach to Diversified Time Series Forecasting	Nov 9, 2021	DecoderQuantization	—Unverified	0
Differential Modulation in Massive MIMO With Low-Resolution ADCs	Nov 9, 2021	Quantization	—Unverified	0
ML-EXray: Visibility into ML Deployment on the Edge	Nov 8, 2021	Quantization	—Unverified	0
Rethinking Deconvolution for 2D Human Pose Estimation Light yet Accurate Model for Real-time Edge Computing	Nov 8, 2021	2D Human Pose EstimationDecoder	—Unverified	0
LiMuSE: Lightweight Multi-modal Speaker Extraction	Nov 7, 2021	Model CompressionQuantization	CodeCode Available	1
MQBench: Towards Reproducible and Deployable Model Quantization Benchmark	Nov 5, 2021	CPUGPU	CodeCode Available	1
LW-GCN: A Lightweight FPGA-based Graph Convolutional Network Accelerator	Nov 4, 2021	CPUGPU	—Unverified	0
Qimera: Data-free Quantization with Synthetic Boundary Supporting Samples	Nov 4, 2021	Data Free QuantizationDisentanglement	CodeCode Available	1
Constructing High-Order Signed Distance Maps from Computed Tomography Data with Application to Bone Morphometry	Nov 2, 2021	Quantization	—Unverified	0
HW-TSC’s Participation in the WMT 2021 Efficiency Shared Task	Nov 1, 2021	CPUDecoder	—Unverified	0
Efficient Machine Translation with Model Pruning and Quantization	Nov 1, 2021	CPUDecoder	—Unverified	0
Matching-oriented Embedding Quantization For Ad-hoc Retrieval	Nov 1, 2021	QuantizationRetrieval	CodeCode Available	1
Simple and Effective Unsupervised Redundancy Elimination to Compress Dense Vectors for Passage Retrieval	Nov 1, 2021	Open-Domain Question AnsweringPassage Retrieval	—Unverified	0
Block-wise Word Embedding Compression Revisited: Better Weighting and Structuring	Nov 1, 2021	Quantization	CodeCode Available	1
Arch-Net: Model Distillation for Architecture Agnostic Model Deployment	Nov 1, 2021	image-classificationImage Classification	CodeCode Available	1
Structure Information is the Key: Self-Attention RoI Feature Extractor in 3D Object Detection	Nov 1, 2021	2D Object Detection3D Object Detection	—Unverified	0
PP-ShiTu: A Practical Lightweight Image Recognition System	Nov 1, 2021	Face RecognitionKnowledge Distillation	CodeCode Available	0
Reconfigurable Intelligent Surface-induced Randomness for mmWave Key Generation	Oct 31, 2021	Quantization	—Unverified	0
DAdaQuant: Doubly-adaptive quantization for communication-efficient Federated Learning	Oct 31, 2021	Federated LearningPrivacy Preserving	—Unverified	0
Revealing and Protecting Labels in Distributed Training	Oct 31, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	0
RMSMP: A Novel Deep Neural Network Quantization Framework with Row-wise Mixed Schemes and Multiple Precisions	Oct 30, 2021	image-classificationImage Classification	—Unverified	0
ILMPQ : An Intra-Layer Multi-Precision Deep Neural Network Quantization framework for FPGA	Oct 30, 2021	Edge-computingModel Compression	—Unverified	0
Nash equilibrium of multi-agent graphical game with a privacy information encrypted learning algorithm	Oct 29, 2021	Quantization	—Unverified	0
FAST: DNN Training Under Variable Precision Block Floating Point with Stochastic Rounding	Oct 28, 2021	Quantization	—Unverified	0
MERCURY: Accelerating DNN Training By Exploiting Input Similarity	Oct 28, 2021	Quantization	—Unverified	0
VQ-GNN: A Universal Framework to Scale up Graph Neural Networks using Vector Quantization	Oct 27, 2021	Link PredictionLink Property Prediction	CodeCode Available	1
Differential Deep Detection in Massive MIMO With One-Bit ADC	Oct 27, 2021	Quantization	—Unverified	0
TOD: GPU-accelerated Outlier Detection via Tensor Operations	Oct 26, 2021	CPUFraud Detection	CodeCode Available	1
High-Order Signed Distance Transform of Sampled Signals	Oct 26, 2021	QuantizationUnity	—Unverified	0
Qu-ANTI-zation: Exploiting Quantization Artifacts for Achieving Adversarial Outcomes	Oct 26, 2021	Backdoor AttackFederated Learning	CodeCode Available	1
Demystifying and Generalizing BinaryConnect	Oct 25, 2021	Quantization	—Unverified	0
Algorithms for the Communication of Samples	Oct 25, 2021	Quantization	—Unverified	0
Convolutional Autoencoder-Based Phase Shift Feedback Compression for Intelligent Reflecting Surface-Assisted Wireless Systems	Oct 24, 2021	Quantization	CodeCode Available	1
Task-Based Graph Signal Compression	Oct 24, 2021	Quantization	CodeCode Available	0

Show:10 25 50

← PrevPage 63 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified