Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3151–3200 of 4925 papers

Title	Date	Tasks	Status
Neural Compression-Based Feature Learning for Video Restoration	Mar 17, 2022	DenoisingQuantization	—Unverified
Convert, compress, correct: Three steps toward communication-efficient DNN training	Mar 17, 2022	Quantization	CodeCode Available
Covariance Recovery for One-Bit Sampled Data With Time-Varying Sampling Thresholds-Part I: Stationary Signals	Mar 16, 2022	QuantizationRelation	—Unverified
Implicit Feature Decoupling with Depthwise Quantization	Mar 15, 2022	DecoderQuantization	CodeCode Available
Learning Spatio-Temporal Downsampling for Effective Video Upscaling	Mar 15, 2022	Quantization	—Unverified
Privacy-Preserving Speech Representation Learning using Vector Quantization	Mar 15, 2022	Privacy PreservingQuantization	—Unverified
TAS: Ternarized Neural Architecture Search for Resource-Constrained Edge Devices	Mar 14, 2022	Neural Architecture SearchQuantization	CodeCode Available
A Mixed Quantization Network for Computationally Efficient Mobile Inverse Tone Mapping	Mar 12, 2022	inverse tone mappingInverse-Tone-Mapping	CodeCode Available
Video Coding for Machines with Feature-Based Rate-Distortion Optimization	Mar 11, 2022	Quantization	—Unverified
Wireless Quantized Federated Learning: A Joint Computation and Communication Design	Mar 11, 2022	Federated LearningQuantization	—Unverified
An Empirical Study of Low Precision Quantization for TinyML	Mar 10, 2022	BIG-bench Machine LearningModel Compression	—Unverified
Power-of-Two Quantization for Low Bitwidth and Hardware Compliant Neural Networks	Mar 9, 2022	Quantization	—Unverified
Correlated quantization for distributed mean estimation and optimization	Mar 9, 2022	Distributed OptimizationQuantization	—Unverified
Neural Network Training on In-memory-computing Hardware with Radix-4 Gradients	Mar 9, 2022	Quantization	—Unverified
Givens Coordinate Descent Methods for Rotation Matrix Learning in Trainable Embedding Indexes	Mar 9, 2022	Quantization	—Unverified
YONO: Modeling Multiple Heterogeneous Neural Networks on Microcontrollers	Mar 8, 2022	Multi-Task LearningQuantization	—Unverified
Practical cognitive speech compression	Mar 8, 2022	DecoderQuantization	—Unverified
A comparative study of several ADPCM schemes with linear and nonlinear prediction	Mar 7, 2022	PredictionQuantization	—Unverified
Forward Link Analysis for Full-Duplex Cellular Networks with Low Resolution ADC/DAC	Mar 7, 2022	Quantization	—Unverified
Non-linear predictive vector quantization of speech	Mar 7, 2022	Quantization	—Unverified
Tabula: Efficiently Computing Nonlinear Activation Functions for Secure Neural Network Inference	Mar 5, 2022	Quantization	—Unverified
Transformations in Learned Image Compression from a Modulation Perspective	Mar 4, 2022	Image CompressionQuantization	—Unverified
Improving the Energy Efficiency and Robustness of tinyML Computer Vision using Log-Gradient Input Images	Mar 4, 2022	Neural Architecture SearchQuantization	—Unverified
On the relevance of language in speaker recognition	Mar 4, 2022	QuantizationSpeaker Recognition	—Unverified
Joint Optimization of Rate, Distortion, and Decoding Energy for HEVC Intraframe Coding	Mar 3, 2022	DecoderQuantization	—Unverified
ARM 4-BIT PQ: SIMD-based Acceleration for Approximate Nearest Neighbor Search on ARM	Mar 3, 2022	Quantization	—Unverified
Region-of-Interest Based Neural Video Compression	Mar 3, 2022	QuantizationVideo Compression	—Unverified
Engineering the Neural Automatic Passenger Counter	Mar 2, 2022	Quantization	—Unverified
Comprehensive Analysis of the Object Detection Pipeline on UAVs	Mar 1, 2022	Camera Calibrationdistortion correction	CodeCode Available
LISA: Learning Interpretable Skill Abstractions from Language	Feb 28, 2022	Decision MakingImitation Learning	CodeCode Available
High Dimensional Statistical Estimation under Uniformly Dithered One-bit Quantization	Feb 26, 2022	compressed sensingLow-Rank Matrix Completion	—Unverified
A blob method for inhomogeneous diffusion with applications to multi-agent control and sampling	Feb 25, 2022	Quantization	—Unverified
ANTLER: Bayesian Nonlinear Tensor Learning and Modeler for Unstructured, Varying-Size Point Cloud Data	Feb 25, 2022	Dimensionality ReductionQuantization	—Unverified
The effect of fatigue on the performance of online writer recognition	Feb 24, 2022	Dynamic Time WarpingQuantization	—Unverified
A comparative study of several parameterizations for speaker recognition	Feb 24, 2022	QuantizationSpeaker Recognition	—Unverified
Standard Deviation-Based Quantization for Deep Neural Networks	Feb 24, 2022	Quantization	—Unverified
Minimax Optimal Quantization of Linear Models: Information-Theoretic Limits and Efficient Algorithms	Feb 23, 2022	Quantization	—Unverified
Energy-Efficient Respiratory Anomaly Detection in Premature Newborn Infants	Feb 21, 2022	Anomaly DetectionModel Selection	—Unverified
Diversity in deep generative models and generative AI	Feb 19, 2022	BIG-bench Machine LearningDecoder	CodeCode Available
Amenable Sparse Network Investigator	Feb 18, 2022	Quantization	—Unverified
VCVTS: Multi-speaker Video-to-Speech synthesis via cross-modal knowledge transfer from voice conversion	Feb 18, 2022	QuantizationSpeech Synthesis	—Unverified
LG-LSQ: Learned Gradient Linear Symmetric Quantization	Feb 18, 2022	Quantization	—Unverified
Quantisation-aware Precoding for MU-MIMO with Limited-capacity Fronthaul	Feb 17, 2022	Quantization	—Unverified
Explaining Reject Options of Learning Vector Quantization Classifiers	Feb 15, 2022	counterfactualQuantization	CodeCode Available
Efficient Cross-Modal Retrieval via Deep Binary Hashing and Quantization	Feb 15, 2022	Cross-Modal RetrievalDeep Hashing	CodeCode Available
Post-Training Quantization for Cross-Platform Learned Image Compression	Feb 15, 2022	Image CompressionQuantization	—Unverified
MuZero with Self-competition for Rate Control in VP9 Video Compression	Feb 14, 2022	Decision MakingQuantization	—Unverified
Vau da muntanialas: Energy-efficient multi-die scalable acceleration of RNN inference	Feb 14, 2022	Quantizationspeech-recognition	—Unverified
Quantization in Layer's Input is Matter	Feb 10, 2022	Quantization	—Unverified
On One-Bit Quantization	Feb 10, 2022	Quantization	—Unverified

Show:10 25 50

← PrevPage 64 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified