Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3451–3500 of 4925 papers

Title	Date	Tasks	Status	Hype
DNN Quantization with Attention	Mar 24, 2021	Object RecognitionQuantization	—Unverified	0
The NLP Cookbook: Modern Recipes for Transformer based Deep Learning Architectures	Mar 23, 2021	Information RetrievalKnowledge Distillation	—Unverified	0
ReCU: Reviving the Dead Weights in Binary Neural Networks	Mar 23, 2021	BinarizationQuantization	CodeCode Available	1
Decomposing Normal and Abnormal Features of Medical Images into Discrete Latent Codes for Content-Based Image Retrieval	Mar 23, 2021	AnatomyContent-Based Image Retrieval	—Unverified	0
Evaluating Post-Training Compression in GANs using Locality-Sensitive Hashing	Mar 22, 2021	DiversityQuantization	—Unverified	0
Resilient Control under Quantization and Denial-of-Service: Co-designing a Deadbeat Controller and Transmission Protocol	Mar 22, 2021	DecoderQuantization	—Unverified	0
n-hot: Efficient bit-level sparsity for powers-of-two neural network quantization	Mar 22, 2021	object-detectionObject Detection	—Unverified	0
Set-Theoretic Learning for Detection in Cell-Less C-RAN Systems	Mar 21, 2021	Quantization	—Unverified	0
Generating Diverse Structure for Image Inpainting With Hierarchical VQ-VAE	Mar 18, 2021	Image InpaintingQuantization	CodeCode Available	1
RangeDet:In Defense of Range View for LiDAR-based 3D Object Detection	Mar 18, 2021	3D Object Detectionobject-detection	CodeCode Available	1
Data-free mixed-precision quantization using novel sensitivity metric	Mar 18, 2021	QuantizationSensitivity	—Unverified	0
Reduced Precision Strategies for Deep Learning: A High Energy Physics Generative Adversarial Network Use Case	Mar 18, 2021	Deep LearningGenerative Adversarial Network	—Unverified	0
Multi-Prize Lottery Ticket Hypothesis: Finding Accurate Binary Neural Networks by Pruning A Randomly Weighted Network	Mar 17, 2021	Classification with Binary Neural NetworkClassification with Binary Weight Network	CodeCode Available	1
Learned Gradient Compression for Distributed Deep Learning	Mar 16, 2021	Deep Learningimage-classification	—Unverified	0
Efficient Randomized Subspace Embeddings for Distributed Optimization under a Communication Budget	Mar 13, 2021	Distributed OptimizationQuantization	CodeCode Available	0
VMAF-based Bitrate Ladder Estimation for Adaptive Streaming	Mar 12, 2021	Quantization	—Unverified	0
BDD4BNN: A BDD-based Quantitative Analysis Framework for Binarized Neural Networks	Mar 12, 2021	Quantization	—Unverified	0
Learnable Companding Quantization for Accurate Low-bit Neural Networks	Mar 12, 2021	image-classificationImage Classification	—Unverified	0
Quantization-Guided Training for Compact TinyML Models	Mar 10, 2021	Human DetectionQuantization	—Unverified	0
Wav2vec-C: A Self-supervised Model for Speech Representation Learning	Mar 9, 2021	QuantizationRepresentation Learning	—Unverified	0
MWQ: Multiscale Wavelet Quantized Neural Networks	Mar 9, 2021	Model CompressionQuantization	—Unverified	0
hls4ml: An Open-Source Codesign Workflow to Empower Scientific Low-Power Machine Learning Devices	Mar 9, 2021	BIG-bench Machine LearningDiagnostic	CodeCode Available	2
Reliability-Aware Quantization for Anti-Aging NPUs	Mar 8, 2021	Quantization	—Unverified	0
Learning Statistical Texture for Semantic Segmentation	Mar 6, 2021	QuantizationSegmentation	CodeCode Available	1
Pufferfish: Communication-efficient Models At No Extra Cost	Mar 5, 2021	Quantization	CodeCode Available	0
Environmental Sound Classification on the Edge: A Pipeline for Deep Acoustic Networks on Extremely Resource-Constrained Devices	Mar 5, 2021	Audio ClassificationEnvironmental Sound Classification	CodeCode Available	1
NETWORK COMPRESSION FOR MACHINE-LEARNT FLUID SIMULATIONS	Mar 4, 2021	Physics-informed machine learningQuantization	—Unverified	0
Deep Neural Network Models Compression	Mar 4, 2021	Knowledge DistillationQuantization	—Unverified	0
Neural Network-based Quantization for Network Automation	Mar 4, 2021	Anomaly DetectionDeep Learning	—Unverified	0
Effective and Fast: A Novel Sequential Single Path Search for Mixed-Precision Quantization	Mar 4, 2021	Quantization	—Unverified	0
Adaptive Transmission for Distributed Detection in Energy Harvesting Wireless Sensor Networks	Mar 3, 2021	Quantization	—Unverified	0
Self-Distribution Binary Neural Networks	Mar 3, 2021	Quantization	CodeCode Available	1
SME: ReRAM-based Sparse-Multiplication-Engine to Squeeze-Out Bit Sparsity of Neural Network	Mar 2, 2021	Quantization	—Unverified	0
Improved Techniques for Quantizing Deep Networks with Adaptive Bit-Widths	Mar 2, 2021	image-classificationImage Classification	—Unverified	0
A Structurally Regularized Convolutional Neural Network for Image Classification using Wavelet-based SubBand Decomposition	Mar 2, 2021	ClassificationGeneral Classification	—Unverified	0
SWIS -- Shared Weight bIt Sparsity for Efficient Neural Network Acceleration	Mar 1, 2021	Efficient Neural NetworkQuantization	—Unverified	0
Diversifying Sample Generation for Accurate Data-Free Quantization	Mar 1, 2021	Data Free Quantizationimage-classification	—Unverified	0
Human Symmetry Uncertainty Detected by a Self-Organizing Neural Network Map	Feb 27, 2021	Quantization	—Unverified	0
Fronthaul Compression and Passive Beamforming Design for Intelligent Reflecting Surface-aided Cloud Radio Access Networks	Feb 25, 2021	Quantization	—Unverified	0
Improving Approximate Optimal Transport Distances using Quantization	Feb 25, 2021	Quantization	—Unverified	0
Quantization Algorithms for Random Fourier Features	Feb 25, 2021	compressed sensingDimensionality Reduction	—Unverified	0
FIXAR: A Fixed-Point Deep Reinforcement Learning Platform with Quantization-Aware Training and Adaptive Parallelism	Feb 24, 2021	CPUDeep Reinforcement Learning	—Unverified	0
QuPeL: Quantized Personalization with Applications to Federated Learning	Feb 23, 2021	DiversityFederated Learning	—Unverified	0
Mixed-Precision Quantization and Parallel Implementation of Multispectral Riemannian Classification for Brain--Machine Interfaces	Feb 22, 2021	General ClassificationMotor Imagery	CodeCode Available	0
Ps and Qs: Quantization-aware pruning for efficient low latency neural network inference	Feb 22, 2021	Bayesian OptimizationComputational Efficiency	CodeCode Available	0
Multi-Agent Consensus Subject to Communication and Privacy Constraints	Feb 21, 2021	Quantization	—Unverified	0
BSQ: Exploring Bit-Level Sparsity for Mixed-Precision Neural Network Quantization	Feb 20, 2021	Neural Architecture SearchQuantization	CodeCode Available	1
GradFreeBits: Gradient Free Bit Allocation for Dynamic Low Precision Neural Networks	Feb 18, 2021	Quantization	—Unverified	0
Peering Beyond the Gradient Veil with Distributed Auto Differentiation	Feb 18, 2021	Quantization	—Unverified	0
RFI Mitigation for One-bit UWB Radar Systems	Feb 17, 2021	Computational EfficiencyQuantization	—Unverified	0

Show:10 25 50

← PrevPage 70 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified