Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2901–2950 of 4925 papers

Title	Date	Tasks	Status	Hype
Unified Multivariate Gaussian Mixture for Efficient Neural Image Compression	Mar 21, 2022	Image CompressionQuantization	CodeCode Available	1
Symbol quantization in interstellar communications: methods and observations	Mar 18, 2022	Quantization	—Unverified	0
Image Storage on Synthetic DNA Using Autoencoders	Mar 18, 2022	Image CompressionQuantization	—Unverified	0
Convert, compress, correct: Three steps toward communication-efficient DNN training	Mar 17, 2022	Quantization	CodeCode Available	0
Neural Compression-Based Feature Learning for Video Restoration	Mar 17, 2022	DenoisingQuantization	—Unverified	0
Mixed-Precision Neural Network Quantization via Learned Layer-wise Importance	Mar 16, 2022	GPUQuantization	CodeCode Available	1
Covariance Recovery for One-Bit Sampled Data With Time-Varying Sampling Thresholds-Part I: Stationary Signals	Mar 16, 2022	QuantizationRelation	—Unverified	0
Privacy-Preserving Speech Representation Learning using Vector Quantization	Mar 15, 2022	Privacy PreservingQuantization	—Unverified	0
Implicit Feature Decoupling with Depthwise Quantization	Mar 15, 2022	DecoderQuantization	CodeCode Available	0
Learning Spatio-Temporal Downsampling for Effective Video Upscaling	Mar 15, 2022	Quantization	—Unverified	0
TAS: Ternarized Neural Architecture Search for Resource-Constrained Edge Devices	Mar 14, 2022	Neural Architecture SearchQuantization	CodeCode Available	0
The Optimal BERT Surgeon: Scalable and Accurate Second-Order Pruning for Large Language Models	Mar 14, 2022	CPUQuantization	CodeCode Available	4
Semi-Discrete Normalizing Flows through Differentiable Tessellation	Mar 14, 2022	Quantization	CodeCode Available	1
A Mixed Quantization Network for Computationally Efficient Mobile Inverse Tone Mapping	Mar 12, 2022	inverse tone mappingInverse-Tone-Mapping	CodeCode Available	0
QDrop: Randomly Dropping Quantization for Extremely Low-bit Post-Training Quantization	Mar 11, 2022	image-classificationImage Classification	CodeCode Available	2
Wireless Quantized Federated Learning: A Joint Computation and Communication Design	Mar 11, 2022	Federated LearningQuantization	—Unverified	0
Video Coding for Machines with Feature-Based Rate-Distortion Optimization	Mar 11, 2022	Quantization	—Unverified	0
An Empirical Study of Low Precision Quantization for TinyML	Mar 10, 2022	BIG-bench Machine LearningModel Compression	—Unverified	0
CoCoFL: Communication- and Computation-Aware Federated Learning via Partial NN Freezing and Quantization	Mar 10, 2022	FairnessFederated Learning	CodeCode Available	1
Givens Coordinate Descent Methods for Rotation Matrix Learning in Trainable Embedding Indexes	Mar 9, 2022	Quantization	—Unverified	0
Power-of-Two Quantization for Low Bitwidth and Hardware Compliant Neural Networks	Mar 9, 2022	Quantization	—Unverified	0
Neural Network Training on In-memory-computing Hardware with Radix-4 Gradients	Mar 9, 2022	Quantization	—Unverified	0
Correlated quantization for distributed mean estimation and optimization	Mar 9, 2022	Distributed OptimizationQuantization	—Unverified	0
Practical cognitive speech compression	Mar 8, 2022	DecoderQuantization	—Unverified	0
Dynamic Dual Trainable Bounds for Ultra-low Precision Super-Resolution Networks	Mar 8, 2022	QuantizationSuper-Resolution	CodeCode Available	1
YONO: Modeling Multiple Heterogeneous Neural Networks on Microcontrollers	Mar 8, 2022	Multi-Task LearningQuantization	—Unverified	0
Forward Link Analysis for Full-Duplex Cellular Networks with Low Resolution ADC/DAC	Mar 7, 2022	Quantization	—Unverified	0
A comparative study of several ADPCM schemes with linear and nonlinear prediction	Mar 7, 2022	PredictionQuantization	—Unverified	0
ZippyPoint: Fast Interest Point Detection, Description, and Matching through Mixed Precision Discretization	Mar 7, 2022	Homography EstimationInterest Point Detection	CodeCode Available	1
Non-linear predictive vector quantization of speech	Mar 7, 2022	Quantization	—Unverified	0
Tabula: Efficiently Computing Nonlinear Activation Functions for Secure Neural Network Inference	Mar 5, 2022	Quantization	—Unverified	0
Improving the Energy Efficiency and Robustness of tinyML Computer Vision using Log-Gradient Input Images	Mar 4, 2022	Neural Architecture SearchQuantization	—Unverified	0
On the relevance of language in speaker recognition	Mar 4, 2022	QuantizationSpeaker Recognition	—Unverified	0
Patch Similarity Aware Data-Free Quantization for Vision Transformers	Mar 4, 2022	Data Free QuantizationQuantization	CodeCode Available	1
Transformations in Learned Image Compression from a Modulation Perspective	Mar 4, 2022	Image CompressionQuantization	—Unverified	0
ARM 4-BIT PQ: SIMD-based Acceleration for Approximate Nearest Neighbor Search on ARM	Mar 3, 2022	Quantization	—Unverified	0
Joint Optimization of Rate, Distortion, and Decoding Energy for HEVC Intraframe Coding	Mar 3, 2022	DecoderQuantization	—Unverified	0
Autoregressive Image Generation using Residual Quantization	Mar 3, 2022	Conditional Image GenerationImage Generation	CodeCode Available	3
Region-of-Interest Based Neural Video Compression	Mar 3, 2022	QuantizationVideo Compression	—Unverified	0
Engineering the Neural Automatic Passenger Counter	Mar 2, 2022	Quantization	—Unverified	0
Comprehensive Analysis of the Object Detection Pipeline on UAVs	Mar 1, 2022	Camera Calibrationdistortion correction	CodeCode Available	0
LISA: Learning Interpretable Skill Abstractions from Language	Feb 28, 2022	Decision MakingImitation Learning	CodeCode Available	0
Arrhythmia Classifier Using Convolutional Neural Network with Adaptive Loss-aware Multi-bit Networks Quantization	Feb 27, 2022	Arrhythmia DetectionQuantization	CodeCode Available	1
High Dimensional Statistical Estimation under Uniformly Dithered One-bit Quantization	Feb 26, 2022	compressed sensingLow-Rank Matrix Completion	—Unverified	0
A blob method for inhomogeneous diffusion with applications to multi-agent control and sampling	Feb 25, 2022	Quantization	—Unverified	0
ANTLER: Bayesian Nonlinear Tensor Learning and Modeler for Unstructured, Varying-Size Point Cloud Data	Feb 25, 2022	Dimensionality ReductionQuantization	—Unverified	0
A comparative study of several parameterizations for speaker recognition	Feb 24, 2022	QuantizationSpeaker Recognition	—Unverified	0
Standard Deviation-Based Quantization for Deep Neural Networks	Feb 24, 2022	Quantization	—Unverified	0
Retriever: Learning Content-Style Representation as a Token-Level Bipartite Graph	Feb 24, 2022	DecoderQuantization	CodeCode Available	1
The effect of fatigue on the performance of online writer recognition	Feb 24, 2022	Dynamic Time WarpingQuantization	—Unverified	0

Show:10 25 50

← PrevPage 59 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified