Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3351–3400 of 4925 papers

Title	Date	Tasks	Status	Hype
Verifying Quantized Neural Networks using SMT-Based Model Checking	Jun 10, 2021	image-classificationImage Classification	—Unverified	0
Conditional COT-GAN for Video Prediction with Kernel Smoothing	Jun 10, 2021	PredictionQuantization	CodeCode Available	0
Harnessing Unrecognizable Faces for Improving Face Recognition	Jun 8, 2021	Face RecognitionQuantization	—Unverified	0
Theoretically Better and Numerically Faster Distributed Optimization with Smoothness-Aware Quantization Techniques	Jun 7, 2021	BIG-bench Machine LearningDistributed Optimization	—Unverified	0
Task-driven Semantic Coding via Reinforcement Learning	Jun 7, 2021	Face DetectionLicense Plate Detection	CodeCode Available	1
Deep Unsupervised Learning for Joint Antenna Selection and Hybrid Beamforming	Jun 6, 2021	Quantization	—Unverified	0
Differentiable Dynamic Quantization with Mixed Precision and Adaptive Resolution	Jun 4, 2021	Quantization	—Unverified	0
Sigma-Delta and Distributed Noise-Shaping Quantization Methods for Random Fourier Features	Jun 4, 2021	Quantization	—Unverified	0
Granger Causality from Quantized Measurements	Jun 3, 2021	Gaussian ProcessesQuantization	—Unverified	0
Passive Beamforming Design for Intelligent Reflecting Surface Assisted MIMO Systems	Jun 2, 2021	Quantization	—Unverified	0
On the Distribution, Sparsity, and Inference-time Quantization of Attention Values in Transformers	Jun 2, 2021	QuantizationQuestion Answering	—Unverified	0
Gender Bias Amplification During Speed-Quality Optimization in Neural Machine Translation	Jun 1, 2021	DecoderMachine Translation	—Unverified	0
Full-Resolution Encoder-Decoder Networks with Multi-Scale Feature Fusion for Human Pose Estimation	Jun 1, 2021	2D Human Pose EstimationDecoder	—Unverified	0
Transferable Sparse Adversarial Attack	May 31, 2021	Adversarial AttackQuantization	CodeCode Available	1
Weak target detection with multi-bit quantization in colocated MIMO radar	May 29, 2021	Quantization	—Unverified	0
Integer-Only Neural Network Quantization Scheme Based on Shift-Batch-Normalization	May 28, 2021	Quantization	CodeCode Available	0
Improved Convergence Rate for a Distributed Two-Time-Scale Gradient Method under Random Quantization	May 28, 2021	Quantization	—Unverified	0
Linear-Time Self Attention with Codeword Histogram for Efficient Recommendation	May 28, 2021	QuantizationSequential Recommendation	CodeCode Available	1
Low-complexity acoustic scene classification for multi-device audio: analysis of DCASE 2021 Challenge systems	May 28, 2021	Acoustic Scene ClassificationQuantization	CodeCode Available	0
Towards Efficient Full 8-bit Integer DNN Online Training on Resource-limited Devices without Batch Normalization	May 27, 2021	Model CompressionQuantization	—Unverified	0
Quantization and Deployment of Deep Neural Networks on Microcontrollers	May 27, 2021	Activity RecognitionHuman Activity Recognition	CodeCode Available	0
HDRUNet: Single Image HDR Reconstruction with Denoising and Dequantization	May 27, 2021	DecoderDenoising	CodeCode Available	0
Dynamic Probabilistic Pruning: A general framework for hardware-constrained pruning at different granularities	May 26, 2021	image-classificationImage Classification	—Unverified	0
DTNN: Energy-efficient Inference with Dendrite Tree Inspired Neural Networks for Edge Vision Applications	May 25, 2021	Quantization	—Unverified	0
Post-Training Sparsity-Aware Quantization	May 23, 2021	Quantization	CodeCode Available	1
Denoising Noisy Neural Networks: A Bayesian Approach with Compensation	May 22, 2021	DenoisingQuantization	CodeCode Available	0
EuclidNets: Combining hardware and architecture design for Efficient Inference and Training	May 21, 2021	Quantization	—Unverified	0
Revisiting Multi-Codebook Quantization	May 21, 2021	QuantizationRetrieval	CodeCode Available	0
DoStoVoQ: Doubly Stochastic Voronoi Vector Quantization SGD for Federated Learning	May 21, 2021	Federated LearningQuantization	—Unverified	0
Extremely Lightweight Quantization Robust Real-Time Single-Image Super Resolution for Mobile Devices	May 21, 2021	image-classificationImage Classification	CodeCode Available	1
Model Compression	May 20, 2021	BIG-bench Machine Learningmodel	—Unverified	0
Distribution Agnostic Symbolic Representations for Time Series Dimensionality Reduction and Online Anomaly Detection	May 20, 2021	Anomaly DetectionClustering	CodeCode Available	0
Towards Quantized Model Parallelism for Graph-Augmented MLPs Based on Gradient-Free ADMM Framework	May 20, 2021	Quantization	CodeCode Available	0
Anchor-based Plain Net for Mobile Image Super-Resolution	May 20, 2021	Image Super-ResolutionQuantization	CodeCode Available	1
BatchQuant: Quantized-for-all Architecture Search with Robust Quantizer	May 19, 2021	AllGPU	CodeCode Available	0
Self-supervised Remote Sensing Images Change Detection at Pixel-level	May 18, 2021	Change DetectionContrastive Learning	—Unverified	0
Is In-Domain Data Really Needed? A Pilot Study on Cross-Domain Calibration for Network Quantization	May 16, 2021	Quantization	—Unverified	0
FDDH: Fast Discriminative Discrete Hashing for Large-Scale Cross-Modal Retrieval	May 15, 2021	Cross-Modal RetrievalQuantization	CodeCode Available	0
Lightweight Compression of Intermediate Neural Network Features for Collaborative Intelligence	May 15, 2021	object-detectionObject Detection	—Unverified	0
Quantized Proximal Averaging Network for Analysis Sparse Coding	May 13, 2021	Image ReconstructionQuantization	—Unverified	0
Discrete representations in neural models of spoken language	May 12, 2021	AttributeQuantization	CodeCode Available	0
A CNN-based Prediction-Aware Quality Enhancement Framework for VVC	May 12, 2021	Quantization	—Unverified	0
Deep and Shallow Covariance Feature Quantization for 3D Facial Expression Recognition	May 12, 2021	3D Facial Expression RecognitionFacial Expression Recognition	—Unverified	0
3U-EdgeAI: Ultra-Low Memory Training, Ultra-Low BitwidthQuantization, and Ultra-Low Latency Acceleration	May 11, 2021	Model CompressionQuantization	—Unverified	0
Estimation and Quantization of Expected Persistence Diagrams	May 11, 2021	QuantizationTime Series	—Unverified	0
Continual Learning via Bit-Level Information Preserving	May 10, 2021	Continual LearningQuantization	CodeCode Available	1
In-Hindsight Quantization Range Estimation for Quantized Training	May 10, 2021	image-classificationImage Classification	—Unverified	0
Joint Learning of Deep Retrieval Model and Product Quantization based Embedding Index	May 9, 2021	QuantizationRetrieval	CodeCode Available	1
RBNN: Memory-Efficient Reconfigurable Deep Binary Neural Network with IP Protection for Internet of Things	May 9, 2021	Quantization	—Unverified	0
Pareto-Optimal Quantized ResNet Is Mostly 4-bit	May 7, 2021	Quantization	CodeCode Available	1

Show:10 25 50

← PrevPage 68 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified