Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3151–3200 of 4925 papers

Title	Date	Tasks	Status	Hype
Deep Asymmetric Hashing with Dual Semantic Regression and Class Structure Quantization	Oct 24, 2021	Deep HashingImage Retrieval	—Unverified	0
A Layer-wise Adversarial-aware Quantization Optimization for Improving Robustness	Oct 23, 2021	Quantization	—Unverified	0
QuantumNAT: Quantum Noise-Aware Training with Noise Injection, Quantization and Normalization	Oct 21, 2021	DenoisingQuantization	CodeCode Available	2
Vis-TOP: Visual Transformer Overlay Processor	Oct 21, 2021	CPUGPU	—Unverified	0
A TinyML Platform for On-Device Continual Learning with Quantized Latent Replays	Oct 20, 2021	Continual LearningQuantization	—Unverified	0
Continuous Control with Action Quantization from Demonstrations	Oct 19, 2021	continuous-controlContinuous Control	—Unverified	0
PR-CIM: a Variation-Aware Binary-Neural-Network Framework for Process-Resilient Computation-in-memory	Oct 19, 2021	Quantization	—Unverified	0
Wideband and Entropy-Aware Deep Soft Bit Quantization	Oct 18, 2021	Quantization	CodeCode Available	0
Sub-bit Neural Networks: Learning to Compress and Accelerate Binary Neural Networks	Oct 18, 2021	Quantization	CodeCode Available	1
Low-Precision Quantization for Efficient Nearest Neighbor Search	Oct 17, 2021	Information RetrievalQuantization	—Unverified	0
Graph-less Neural Networks: Teaching Old MLPs New Tricks via Distillation	Oct 17, 2021	Knowledge DistillationNode Classification	CodeCode Available	1
BNAS v2: Learning Architectures for Binary Networks with Empirical Improvements	Oct 16, 2021	Quantization	CodeCode Available	1
Training Deep Neural Networks with Joint Quantization and Pruning of Weights and Activations	Oct 15, 2021	Network PruningQuantization	CodeCode Available	1
PTQ-SL: Exploring the Sub-layerwise Post-training Quantization	Oct 15, 2021	Quantization	—Unverified	0
SpeechT5: Unified-Modal Encoder-Decoder Pre-Training for Spoken Language Processing	Oct 14, 2021	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	1
A Memory-Efficient Learning Framework for SymbolLevel Precoding with Quantized NN Weights	Oct 13, 2021	Model CompressionQuantization	—Unverified	0
Towards Mixed-Precision Quantization of Neural Networks via Constrained Optimization	Oct 13, 2021	Multiple-choiceQuantization	—Unverified	0
Toward nonlinear dynamic control over encrypted data for infinite time horizon	Oct 12, 2021	Quantization	—Unverified	0
Learning Discrete Representations via Constrained Clustering for Effective and Efficient Dense Retrieval	Oct 12, 2021	ClusteringConstrained Clustering	CodeCode Available	1
Memory-Efficient CNN Accelerator Based on Interlayer Feature Map Compression	Oct 12, 2021	Feature CompressionQuantization	—Unverified	0
A comprehensive review of Binary Neural Network	Oct 11, 2021	BinarizationQuantization	—Unverified	0
Are Words the Quanta of Human Language? Extending the Domain of Quantum Cognition	Oct 10, 2021	Cultural Vocal Bursts Intensity PredictionInformation Retrieval	—Unverified	0
Haar Wavelet Feature Compression for Quantized Graph Convolutional Networks	Oct 10, 2021	Feature CompressionNode Classification	—Unverified	0
A Deep Learning Inference Scheme Based on Pipelined Matrix Multiplication Acceleration Design and Non-uniform Quantization	Oct 10, 2021	Edge-computingQ-Learning	—Unverified	0
Cognitive Coding of Speech	Oct 8, 2021	Dimensionality ReductionQuantization	—Unverified	0
LCS: Learning Compressible Subspaces for Adaptive Network Compression at Inference Time	Oct 8, 2021	Quantization	CodeCode Available	1
Federated Learning via Plurality Vote	Oct 6, 2021	Federated LearningQuantization	CodeCode Available	0
8-bit Optimizers via Block-wise Quantization	Oct 6, 2021	Language ModelingLanguage Modelling	CodeCode Available	3
Shifting Capsule Networks from the Cloud to the Deep Edge	Oct 6, 2021	Quantization	CodeCode Available	0
Random matrices in service of ML footprint: ternary random features with no performance loss	Oct 5, 2021	Quantization	CodeCode Available	1
Attention Augmented Convolutional Transformer for Tabular Time-series	Oct 5, 2021	Language ModelingLanguage Modelling	—Unverified	0
FedDQ: Communication-Efficient Federated Learning with Descending Quantization	Oct 5, 2021	Federated LearningModel Compression	—Unverified	0
Pre-Quantized Deep Learning Models Codified in ONNX to Enable Hardware/Software Co-Design	Oct 4, 2021	Quantization	—Unverified	0
SDR: Efficient Neural Re-ranking using Succinct Document Representation	Oct 3, 2021	Information RetrievalQuantization	—Unverified	0
Beyond Neighbourhood-Preserving Transformations for Quantization-Based Unsupervised Hashing	Oct 1, 2021	Quantization	—Unverified	0
Towards Efficient Post-training Quantization of Pre-trained Language Models	Sep 30, 2021	Quantization	—Unverified	0
Riemannian Manifold Embeddings for Straight-Through Estimator	Sep 29, 2021	Quantization	—Unverified	0
Full-Precision Free Binary Graph Neural Networks	Sep 29, 2021	Graph Neural NetworkMixture-of-Experts	—Unverified	0
Beyond Quantization: Power aware neural networks	Sep 29, 2021	Quantization	—Unverified	0
Faster Neural Net Inference via Forests of Sparse Oblique Decision Trees	Sep 29, 2021	Quantization	—Unverified	0
Delving into Channels: Exploring Hyperparameter Space of Channel Bit Widths with Linear Complexity	Sep 29, 2021	CPUQuantization	—Unverified	0
PIVQGAN: Posture and Identity Disentangled Image-to-Image Translation via Vector Quantization	Sep 29, 2021	DisentanglementImage-to-Image Translation	—Unverified	0
Post-Training Quantization Is All You Need to Perform Cross-Platform Learned Image Compression	Sep 29, 2021	AllImage Compression	—Unverified	0
Lattice Quantization	Sep 29, 2021	Quantization	—Unverified	0
Quantized sparse PCA for neural network weight compression	Sep 29, 2021	Quantization	—Unverified	0
Wavelet Feature Maps Compression for Low Bandwidth Convolutional Neural Networks	Sep 29, 2021	Depth EstimationDepth Prediction	—Unverified	0
Contrastive Mutual Information Maximization for Binary Neural Networks	Sep 29, 2021	BinarizationContrastive Learning	—Unverified	0
Specialized Transformers: Faster, Smaller and more Accurate NLP Models	Sep 29, 2021	Hard AttentionQuantization	—Unverified	0
Logarithmic Unbiased Quantization: Practical 4-bit Training in Deep Learning	Sep 29, 2021	Deep LearningQuantization	—Unverified	0
Succinct Compression: Near-Optimal and Lossless Compression of Deep Neural Networks during Inference Runtime	Sep 29, 2021	Quantization	—Unverified	0

Show:10 25 50

← PrevPage 64 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified