Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4151–4200 of 4925 papers

Title	Date	Tasks	Status
Compression without Quantization	Sep 25, 2019	DecoderImage Compression	—Unverified
Rethinking Neural Network Quantization	Sep 25, 2019	Quantization	—Unverified
Online Learned Continual Compression with Stacked Quantization Modules	Sep 25, 2019	Continual LearningQuantization	—Unverified
Smart Ternary Quantization	Sep 25, 2019	image-classificationImage Classification	—Unverified
QGAN: Quantize Generative Adversarial Networks to Extreme low-bits	Sep 25, 2019	Quantization	—Unverified
Network Pruning for Low-Rank Binary Index	Sep 25, 2019	Model CompressionNetwork Pruning	—Unverified
CURSOR-BASED ADAPTIVE QUANTIZATION FOR DEEP NEURAL NETWORK	Sep 25, 2019	Quantization	—Unverified
OPTIMAL BINARY QUANTIZATION FOR DEEP NEURAL NETWORKS	Sep 25, 2019	Quantization	—Unverified
Low Rank Training of Deep Neural Networks for Emerging Memory Technology	Sep 25, 2019	Computational EfficiencyDecision Making	—Unverified
GQ-Net: Training Quantization-Friendly Deep Networks	Sep 25, 2019	Model CompressionQuantization	—Unverified
Learning Compact Embedding Layers via Differentiable Product Quantization	Sep 25, 2019	Quantization	—Unverified
Lattice Representation Learning	Sep 25, 2019	DecoderQuantization	—Unverified
Provably Communication-efficient Data-parallel SGD via Nonuniform Quantization	Sep 25, 2019	Quantization	—Unverified
CAT: Compression-Aware Training for bandwidth reduction	Sep 25, 2019	Quantization	CodeCode Available
Learning to Seek: Autonomous Source Seeking with Deep Reinforcement Learning Onboard a Nano Drone Microcontroller	Sep 25, 2019	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available
Forward and Backward Information Retention for Accurate Binary Neural Networks	Sep 24, 2019	BinarizationNeural Network Compression	CodeCode Available
Autoencoder-Based Error Correction Coding for One-Bit Quantization	Sep 24, 2019	Quantization	—Unverified
A System-Level Solution for Low-Power Object Detection	Sep 24, 2019	CPUObject	—Unverified
Gridless Angular Domain Channel Estimation for mmWave Massive MIMO System With One-Bit Quantization Via Approximate Message Passing	Sep 23, 2019	compressed sensingQuantization	—Unverified
HAWKEYE: Adversarial Example Detector for Deep Neural Networks	Sep 22, 2019	Quantization	—Unverified
Structured Binary Neural Networks for Image Recognition	Sep 22, 2019	object-detectionObject Detection	—Unverified
How to design a derivatives market?	Sep 19, 2019	Quantization	—Unverified
Performance Analysis of Massive MIMO Multi-Way Relay Networks with Low-Resolution ADCs	Sep 19, 2019	Quantization	—Unverified
How Does Batch Normalization Help Binary Training?	Sep 18, 2019	Quantization	—Unverified
Fast Large-Scale Discrete Optimization Based on Principal Coordinate Descent	Sep 16, 2019	Quantization	—Unverified
An Empirical Study towards Characterizing Deep Learning Development and Deployment across Different Frameworks and Platforms	Sep 15, 2019	Adversarial AttackAdversarial Robustness	—Unverified
DASNet: Dynamic Activation Sparsity for Neural Network Efficiency Improvement	Sep 13, 2019	Quantization	—Unverified
Neural Machine Translation with 4-Bit Precision and Beyond	Sep 13, 2019	Machine TranslationNMT	—Unverified
Q-BERT: Hessian Based Ultra Low Precision Quantization of BERT	Sep 12, 2019	Linguistic AcceptabilityNatural Language Inference	—Unverified
Variable Rate Deep Image Compression With a Conditional Autoencoder	Sep 11, 2019	Image CompressionQuantization	—Unverified
Communication-Censored Distributed Stochastic Gradient Descent	Sep 9, 2019	QuantizationStochastic Optimization	CodeCode Available
Sparse linear regression with compressed and low-precision data via concave quadratic programming	Sep 9, 2019	Quantizationregression	—Unverified
A Comprehensive Benchmark for Single Image Compression Artifacts Reduction	Sep 9, 2019	4kImage Compression	—Unverified
A Resource-Efficient Embedded Iris Recognition System Using Fully Convolutional Networks	Sep 8, 2019	CPUGPU	CodeCode Available
Restricted Minimum Error Entropy Criterion for Robust Classification	Sep 6, 2019	ClassificationDimensionality Reduction	—Unverified
Quantized Fisher Discriminant Analysis	Sep 6, 2019	BIG-bench Machine LearningDimensionality Reduction	CodeCode Available
DeepEvolution: A Search-Based Testing Approach for Deep Neural Networks	Sep 5, 2019	Autonomous VehiclesDiversity	—Unverified
Training High-Performance and Large-Scale Deep Neural Networks with Full 8-bit Integers	Sep 5, 2019	Quantization	CodeCode Available
Symbol-Level Precoding Design for Intelligent Reflecting Surface Assisted Multi-user MIMO Systems	Sep 3, 2019	Quantization	—Unverified
On the Downstream Performance of Compressed Word Embeddings	Sep 3, 2019	Generalization BoundsQuantization	CodeCode Available
Push for Quantization: Deep Fisher Hashing	Aug 31, 2019	QuantizationSemantic Similarity	—Unverified
PULP-NN: Accelerating Quantized Neural Networks on Parallel Ultra-Low-Power RISC-V Processors	Aug 29, 2019	Quantization	CodeCode Available
An Ultra-Efficient Memristor-Based DNN Framework with Structured Weight Pruning and Quantization Using ADMM	Aug 29, 2019	Quantization	—Unverified
Smaller Models, Better Generalization	Aug 29, 2019	Quantization	—Unverified
Accelerating Large-Scale Inference with Anisotropic Vector Quantization	Aug 27, 2019	BenchmarkingQuantization	CodeCode Available
Tiny but Accurate: A Pruned, Quantized and Optimized Memristor Crossbar Framework for Ultra Efficient DNN Implementation	Aug 27, 2019	Model CompressionQuantization	—Unverified
Differentiable Product Quantization for End-to-End Embedding Compression	Aug 26, 2019	Quantization	CodeCode Available
Incremental Binarization On Recurrent Neural Networks For Single-Channel Source Separation	Aug 23, 2019	BinarizationQuantization	—Unverified
RATQ: A Universal Fixed-Length Quantizer for Stochastic Optimization	Aug 22, 2019	QuantizationStochastic Optimization	—Unverified
A Gridless Compressive Sensing Based Channel Estimation for Millimeter Wave MIMO OFDM Systems with One-Bit Quantization	Aug 19, 2019	Compressive SensingQuantization	—Unverified

Show:10 25 50

← PrevPage 84 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified