Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3351–3400 of 4925 papers

Title	Date	Tasks	Status
A TinyML Platform for On-Device Continual Learning with Quantized Latent Replays	Oct 20, 2021	Continual LearningQuantization	—Unverified
Continuous Control with Action Quantization from Demonstrations	Oct 19, 2021	continuous-controlContinuous Control	—Unverified
PR-CIM: a Variation-Aware Binary-Neural-Network Framework for Process-Resilient Computation-in-memory	Oct 19, 2021	Quantization	—Unverified
Wideband and Entropy-Aware Deep Soft Bit Quantization	Oct 18, 2021	Quantization	CodeCode Available
Low-Precision Quantization for Efficient Nearest Neighbor Search	Oct 17, 2021	Information RetrievalQuantization	—Unverified
PTQ-SL: Exploring the Sub-layerwise Post-training Quantization	Oct 15, 2021	Quantization	—Unverified
Towards Mixed-Precision Quantization of Neural Networks via Constrained Optimization	Oct 13, 2021	Multiple-choiceQuantization	—Unverified
A Memory-Efficient Learning Framework for SymbolLevel Precoding with Quantized NN Weights	Oct 13, 2021	Model CompressionQuantization	—Unverified
Toward nonlinear dynamic control over encrypted data for infinite time horizon	Oct 12, 2021	Quantization	—Unverified
Memory-Efficient CNN Accelerator Based on Interlayer Feature Map Compression	Oct 12, 2021	Feature CompressionQuantization	—Unverified
A comprehensive review of Binary Neural Network	Oct 11, 2021	BinarizationQuantization	—Unverified
Are Words the Quanta of Human Language? Extending the Domain of Quantum Cognition	Oct 10, 2021	Cultural Vocal Bursts Intensity PredictionInformation Retrieval	—Unverified
A Deep Learning Inference Scheme Based on Pipelined Matrix Multiplication Acceleration Design and Non-uniform Quantization	Oct 10, 2021	Edge-computingQ-Learning	—Unverified
Haar Wavelet Feature Compression for Quantized Graph Convolutional Networks	Oct 10, 2021	Feature CompressionNode Classification	—Unverified
Cognitive Coding of Speech	Oct 8, 2021	Dimensionality ReductionQuantization	—Unverified
Federated Learning via Plurality Vote	Oct 6, 2021	Federated LearningQuantization	CodeCode Available
Shifting Capsule Networks from the Cloud to the Deep Edge	Oct 6, 2021	Quantization	CodeCode Available
Attention Augmented Convolutional Transformer for Tabular Time-series	Oct 5, 2021	Language ModelingLanguage Modelling	—Unverified
FedDQ: Communication-Efficient Federated Learning with Descending Quantization	Oct 5, 2021	Federated LearningModel Compression	—Unverified
Pre-Quantized Deep Learning Models Codified in ONNX to Enable Hardware/Software Co-Design	Oct 4, 2021	Quantization	—Unverified
SDR: Efficient Neural Re-ranking using Succinct Document Representation	Oct 3, 2021	Information RetrievalQuantization	—Unverified
Beyond Neighbourhood-Preserving Transformations for Quantization-Based Unsupervised Hashing	Oct 1, 2021	Quantization	—Unverified
Towards Efficient Post-training Quantization of Pre-trained Language Models	Sep 30, 2021	Quantization	—Unverified
Lidar Range Image Compression with Deep Delta Encoding	Sep 29, 2021	Autonomous DrivingImage Compression	—Unverified
Logarithmic Unbiased Quantization: Practical 4-bit Training in Deep Learning	Sep 29, 2021	Deep LearningQuantization	—Unverified
Beyond Quantization: Power aware neural networks	Sep 29, 2021	Quantization	—Unverified
Toward Efficient Low-Precision Training: Data Format Optimization and Hysteresis Quantization	Sep 29, 2021	Quantization	—Unverified
Succinct Compression: Near-Optimal and Lossless Compression of Deep Neural Networks during Inference Runtime	Sep 29, 2021	Quantization	—Unverified
Contrastive Mutual Information Maximization for Binary Neural Networks	Sep 29, 2021	BinarizationContrastive Learning	—Unverified
Contrastive Quant: Quantization Makes Stronger Contrastive Learning	Sep 29, 2021	Contrastive LearningQuantization	—Unverified
PIVQGAN: Posture and Identity Disentangled Image-to-Image Translation via Vector Quantization	Sep 29, 2021	DisentanglementImage-to-Image Translation	—Unverified
CSQ: Centered Symmetric Quantization for Extremely Low Bit Neural Networks	Sep 29, 2021	Quantization	—Unverified
Specialized Transformers: Faster, Smaller and more Accurate NLP Models	Sep 29, 2021	Hard AttentionQuantization	—Unverified
Post-Training Quantization Is All You Need to Perform Cross-Platform Learned Image Compression	Sep 29, 2021	AllImage Compression	—Unverified
Lattice Quantization	Sep 29, 2021	Quantization	—Unverified
Delving into Channels: Exploring Hyperparameter Space of Channel Bit Widths with Linear Complexity	Sep 29, 2021	CPUQuantization	—Unverified
Differentiable Discrete Device-to-System Codesign for Optical Neural Networks via Gumbel-Softmax	Sep 29, 2021	QuantizationScheduling	—Unverified
Riemannian Manifold Embeddings for Straight-Through Estimator	Sep 29, 2021	Quantization	—Unverified
Revisiting Locality-Sensitive Binary Codes from Random Fourier Features	Sep 29, 2021	Information RetrievalQuantization	—Unverified
Efficient Point Transformer for Large-scale 3D Scene Understanding	Sep 29, 2021	3D Semantic SegmentationQuantization	—Unverified
HoloFormer: Deep Compression of Pre-Trained Transforms via Unified Optimization of N:M Sparsity and Integer Quantization	Sep 29, 2021	Quantization	—Unverified
Faster Neural Net Inference via Forests of Sparse Oblique Decision Trees	Sep 29, 2021	Quantization	—Unverified
Wavelet Feature Maps Compression for Low Bandwidth Convolutional Neural Networks	Sep 29, 2021	Depth EstimationDepth Prediction	—Unverified
Quantized sparse PCA for neural network weight compression	Sep 29, 2021	Quantization	—Unverified
Full-Precision Free Binary Graph Neural Networks	Sep 29, 2021	Graph Neural NetworkMixture-of-Experts	—Unverified
Click-through Rate Prediction with Auto-Quantized Contrastive Learning	Sep 27, 2021	Click-Through Rate PredictionContrastive Learning	—Unverified
Performance Analysis of IRS-Assisted Cell-Free Communication	Sep 26, 2021	Quantization	—Unverified
Communication-Efficient Federated Linear and Deep Generalized Canonical Correlation Analysis	Sep 25, 2021	Distributed ComputingDistributed Optimization	CodeCode Available
Distribution-sensitive Information Retention for Accurate Binary Neural Network	Sep 25, 2021	Binarizationimage-classification	—Unverified
Predicting Attention Sparsity in Transformers	Sep 24, 2021	DecoderLanguage Modeling	—Unverified

Show:10 25 50

← PrevPage 68 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified