Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2651–2700 of 4925 papers

Title	Date	Tasks	Status
Patch-wise Mixed-Precision Quantization of Vision Transformer	May 11, 2023	QuantizationSensitivity	—Unverified
Post-training Model Quantization Using GANs for Synthetic Data Generation	May 10, 2023	QuantizationSynthetic Data Generation	CodeCode Available
Mobile Image Restoration via Prior Quantization	May 10, 2023	Image RestorationQuantization	—Unverified
Multiscale Augmented Normalizing Flows for Image Compression	May 9, 2023	Image CompressionQuantization	—Unverified
Spiking Neural Networks in the Alexiewicz Topology: A New Perspective on Analysis and Error Bounds	May 9, 2023	Quantization	CodeCode Available
CrAFT: Compression-Aware Fine-Tuning for Efficient Visual Task Adaptation	May 8, 2023	GPUModel Compression	—Unverified
Structural and Statistical Texture Knowledge Distillation for Semantic Segmentation	May 6, 2023	Knowledge DistillationQuantization	—Unverified
A multimodal dynamical variational autoencoder for audiovisual speech representation learning	May 5, 2023	DenoisingDisentanglement	CodeCode Available
Emulation Learning for Neuromimetic Systems	May 4, 2023	Model Predictive ControlQuantization	—Unverified
Vertical Federated Learning over Cloud-RAN: Convergence Analysis and System Optimization	May 4, 2023	Federated LearningQuantization	—Unverified
Hybrid model for Single-Stage Multi-Person Pose Estimation	May 2, 2023	Multi-Person Pose EstimationPose Estimation	—Unverified
ICQ: A Quantization Scheme for Best-Arm Identification Over Bit-Constrained Channels	Apr 30, 2023	Quantization	—Unverified
Killing Two Birds with One Stone: Quantization Achieves Privacy in Distributed Learning	Apr 26, 2023	Quantization	—Unverified
Guaranteed Quantization Error Computation for Neural Network Model Compression	Apr 26, 2023	Model CompressionNeural Network Compression	—Unverified
Membrane Potential Distribution Adjustment and Parametric Surrogate Gradient in Spiking Neural Networks	Apr 26, 2023	Quantization	—Unverified
Improving Robustness Against Adversarial Attacks with Deeply Quantized Neural Networks	Apr 25, 2023	Adversarial RobustnessQuantization	—Unverified
Speed Is All You Need: On-Device Acceleration of Large Diffusion Models via GPU-Aware Optimizations	Apr 21, 2023	AllGPU	—Unverified
Transformer-based models and hardware acceleration analysis in autonomous driving: A survey	Apr 21, 2023	Autonomous DrivingAutonomous Vehicles	—Unverified
Picking Up Quantization Steps for Compressed Image Classification	Apr 21, 2023	Classificationimage-classification	CodeCode Available
Improving Post-Training Quantization on Object Detection with Task Loss-Guided Lp Metric	Apr 19, 2023	Objectobject-detection	—Unverified
DeepGEMM: Accelerated Ultra Low-Precision Inference on CPU Architectures using Lookup Tables	Apr 18, 2023	CPUQuantization	—Unverified
ATHEENA: A Toolflow for Hardware Early-Exit Network Automation	Apr 17, 2023	Quantization	—Unverified
Soft Label Coding for End-to-end Sound Source Localization With Ad-hoc Microphone Arrays	Apr 15, 2023	QuantizationSound Source Localization	—Unverified
Convergence rate of Tsallis entropic regularized optimal transport	Apr 13, 2023	Quantization	—Unverified
D-SVM over Networked Systems with Non-Ideal Linking Conditions	Apr 13, 2023	Binary ClassificationDistributed Optimization	—Unverified
Learning Accurate Performance Predictors for Ultrafast Automated Model Compression	Apr 13, 2023	image-classificationImage Classification	CodeCode Available
End-to-end codesign of Hessian-aware quantized neural networks for FPGAs and ASICs	Apr 13, 2023	Quantization	—Unverified
Unsupervised Multi-Criteria Adversarial Detection in Deep Image Retrieval	Apr 9, 2023	Deep HashingDeep Learning	—Unverified
Benchmarking the Robustness of Quantized Models	Apr 8, 2023	BenchmarkingQuantization	—Unverified
Unsupervised Speech Representation Pooling Using Vector Quantization	Apr 8, 2023	Emotion Recognitionintent-classification	CodeCode Available
AutoQNN: An End-to-End Framework for Automatically Quantizing Neural Networks	Apr 7, 2023	Neural Architecture SearchQuantization	—Unverified
FedDiSC: A Computation-efficient Federated Learning Framework for Power Systems Disturbance and Cyber Attack Discrimination	Apr 7, 2023	Federated LearningPrivacy Preserving	—Unverified
Blockwise Compression of Transformer-based Models without Retraining	Apr 4, 2023	Quantization	—Unverified
A Unified Compression Framework for Efficient Speech-Driven Talking-Face Generation	Apr 2, 2023	Face GenerationKnowledge Distillation	—Unverified
Distributed Optimization for Quadratic Cost Functions over Large-Scale Networks with Quantized Communication and Finite-Time Convergence	Apr 2, 2023	Distributed OptimizationFederated Learning	—Unverified
FP8 versus INT8 for efficient deep learning inference	Mar 31, 2023	Deep LearningQuantization	—Unverified
A Joint Model and Data Driven Method for Distributed Estimation	Mar 30, 2023	QuantizationWeather Forecasting	—Unverified
oBERTa: Improving Sparse Transfer Learning via improved initialization, distillation, and pruning regimes	Mar 30, 2023	Knowledge DistillationModel Compression	—Unverified
SC-VAE: Sparse Coding-based Variational Autoencoder with Learned ISTA	Mar 29, 2023	Image GenerationImage Reconstruction	CodeCode Available
Tetra-AML: Automatic Machine Learning via Tensor Networks	Mar 28, 2023	Bayesian OptimizationHyperparameter Optimization	—Unverified
Low-Dose CT Image Reconstruction using Vector Quantized Convolutional Autoencoder with Perceptual Loss	Mar 28, 2023	Computed Tomography (CT)Image Reconstruction	—Unverified
Binarizing Sparse Convolutional Networks for Efficient Point Cloud Analysis	Mar 27, 2023	BinarizationQuantization	—Unverified
An Evaluation of Memory Optimization Methods for Training Neural Networks	Mar 26, 2023	Quantization	—Unverified
LVQAC: Lattice Vector Quantization Coupled with Spatially Adaptive Companding for Efficient Learned Image Compression	Mar 25, 2023	Image CompressionQuantization	—Unverified
Towards Accurate Post-Training Quantization for Vision Transformer	Mar 25, 2023	Model CompressionQuantization	—Unverified
Benchmarking the Reliability of Post-training Quantization: a Particular Focus on Worst-case Performance	Mar 23, 2023	BenchmarkingData Augmentation	—Unverified
The Quantization Model of Neural Scaling	Mar 23, 2023	Language ModelingLanguage Modelling	CodeCode Available
Scaled Quantization for the Vision Transformer	Mar 23, 2023	Quantization	—Unverified
Posthoc Interpretation via Quantization	Mar 22, 2023	Image SegmentationQuantization	—Unverified
Q-HyViT: Post-Training Quantization of Hybrid Vision Transformers with Bridge Block Reconstruction for IoT Systems	Mar 22, 2023	Quantization	CodeCode Available

Show:10 25 50

← PrevPage 54 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified