Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2801–2850 of 4925 papers

Title	Date	Tasks	Status
FlatENN: Train Flat for Enhanced Fault Tolerance of Quantized Deep Neural Networks	Dec 29, 2022	Model CompressionQuantization	—Unverified
Publishing Efficient On-device Models Increases Adversarial Vulnerability	Dec 28, 2022	Quantization	—Unverified
Hyperspherical Loss-Aware Ternary Quantization	Dec 24, 2022	image-classificationImage Classification	—Unverified
Development of a Thermodynamics of Human Cognition and Human Culture	Dec 24, 2022	Cultural Vocal Bursts Intensity PredictionInformation Retrieval	—Unverified
Hyperspherical Quantization: Toward Smaller and More Accurate Models	Dec 24, 2022	Quantization	—Unverified
EuclidNets: An Alternative Operation for Efficient Inference of Deep Learning Models	Dec 22, 2022	Deep LearningQuantization	—Unverified
Cross-Dataset Propensity Estimation for Debiasing Recommender Systems	Dec 22, 2022	Causal InferenceQuantization	—Unverified
Training Integer-Only Deep Recurrent Neural Networks	Dec 22, 2022	Quantization	—Unverified
Automatic Network Adaptation for Ultra-Low Uniform-Precision Quantization	Dec 21, 2022	Neural Architecture SearchQuantization	—Unverified
Towards Neural Variational Monte Carlo That Scales Linearly with System Size	Dec 21, 2022	QuantizationVariational Monte Carlo	—Unverified
CSMPQ:Class Separability Based Mixed-Precision Quantization	Dec 20, 2022	Quantization	—Unverified
Redistribution of Weights and Activations for AdderNet Quantization	Dec 20, 2022	Quantization	—Unverified
Model Predictive Control for Neuromimetic Quantized Systems	Dec 19, 2022	modelModel Predictive Control	—Unverified
Atrous Space Bender U-Net (ASBU-Net/LogiNet)	Dec 16, 2022	QuantizationSegmentation	—Unverified
Joint SPX-VIX calibration with Gaussian polynomial volatility models: deep pricing with quantization hints	Dec 16, 2022	Quantization	—Unverified
NAWQ-SR: A Hybrid-Precision NPU Engine for Efficient On-Device Super-Resolution	Dec 15, 2022	CPUQuantization	—Unverified
Huber-energy measure quantization	Dec 15, 2022	QuantizationStochastic Optimization	—Unverified
Towards Hardware-Specific Automatic Compression of Neural Networks	Dec 15, 2022	Quantizationreinforcement-learning	—Unverified
Image Compression with Product Quantized Masked Image Modeling	Dec 14, 2022	Image CompressionImage Generation	—Unverified
Efficient Speech Representation Learning with Low-Bit Quantization	Dec 14, 2022	Model CompressionQuantization	—Unverified
Adaptive Low-Precision Training for Embeddings in Click-Through Rate Prediction	Dec 12, 2022	Click-Through Rate PredictionPrediction	—Unverified
ResFed: Communication Efficient Federated Learning by Transmitting Deep Compressed Residuals	Dec 11, 2022	Federated LearningQuantization	—Unverified
Error-aware Quantization through Noise Tempering	Dec 11, 2022	Model CompressionQuantization	—Unverified
QVIP: An ILP-based Formal Verification Approach for Quantized Neural Networks	Dec 10, 2022	Quantization	CodeCode Available
Vertical Layering of Quantized Neural Networks for Heterogeneous Inference	Dec 10, 2022	Quantization	—Unverified
Genie: Show Me the Data for Quantization	Dec 9, 2022	Data Free QuantizationQuantization	CodeCode Available
TinyKG: Memory-Efficient Training Framework for Knowledge Graph Neural Recommender Systems	Dec 8, 2022	GPUKnowledge Graphs	—Unverified
QEBVerif: Quantization Error Bound Verification of Neural Networks	Dec 6, 2022	Quantization	CodeCode Available
CSQ: Growing Mixed-Precision Quantization Scheme with Bi-level Continuous Sparsification	Dec 6, 2022	Quantization	—Unverified
Quantized Wasserstein Procrustes Alignment of Word Embedding Spaces	Dec 5, 2022	Bilingual Lexicon InductionQuantization	—Unverified
QFT: Post-training quantization via fast joint finetuning of all degrees of freedom	Dec 5, 2022	AllQuantization	—Unverified
Make RepVGG Greater Again: A Quantization-aware Approach	Dec 3, 2022	QuantizationSemantic Segmentation	CodeCode Available
Device Interoperability for Learned Image Compression with Weights and Activations Quantization	Dec 2, 2022	Image CompressionQuantization	—Unverified
Shining light on data: Geometric data analysis through quantum dynamics	Dec 1, 2022	Dimensionality ReductionQuantization	—Unverified
Robust Task-Specific Beamforming with Low-Resolution ADCs for Power-Efficient Hybrid MIMO Receivers	Nov 30, 2022	Quantization	—Unverified
Quadapter: Adapter for GPT-2 Quantization	Nov 30, 2022	Quantization	—Unverified
Quantization-aware Interval Bound Propagation for Training Certifiably Robust Quantized Neural Networks	Nov 29, 2022	Adversarial RobustnessGPU	CodeCode Available
Distributed Computation of Exact Average Degree and Network Size in Finite Number of Steps under Quantized Communication	Nov 29, 2022	Quantization	—Unverified
Quantized control of non-Lipschitz nonlinear systems: a novel control framework with prescribed transient performance and lower design complexity	Nov 28, 2022	Quantization	—Unverified
Entropy-Driven Mixed-Precision Quantization for Deep Network Design	Nov 28, 2022	CPUFace Detection	—Unverified
Class-based Quantization for Neural Networks	Nov 27, 2022	Quantization	—Unverified
Homology-constrained vector quantization entropy regularizer	Nov 25, 2022	Quantization	CodeCode Available
Vector Quantization Methods for Access Point Placement in Cell-Free Massive MIMO Systems	Nov 23, 2022	Quantization	—Unverified
A 65nm 8b-Activation 8b-Weight SRAM-Based Charge-Domain Computing-in-Memory Macro Using A Fully-Parallel Analog Adder Network and A Single-ADC Interface	Nov 23, 2022	Quantization	—Unverified
RIS-Assisted Self-Interference Mitigation for In-Band Full-Duplex Transceivers	Nov 22, 2022	Quantization	—Unverified
High-Perceptual Quality JPEG Decoding via Posterior Sampling	Nov 21, 2022	JPEG Artifact CorrectionQuantization	—Unverified
Learning Low-Rank Representations for Model Compression	Nov 21, 2022	Clusteringmodel	—Unverified
Understanding and Improving Knowledge Distillation for Quantization-Aware Training of Large Transformer Encoders	Nov 20, 2022	Knowledge DistillationModel Compression	CodeCode Available
A Closed-loop Sleep Modulation System with FPGA-Accelerated Deep Learning	Nov 19, 2022	EEGElectroencephalogram (EEG)	—Unverified
Deep Learning-Aided Perturbation Model-Based Fiber Nonlinearity Compensation	Nov 19, 2022	Deep LearningQuantization	—Unverified

Show:10 25 50

← PrevPage 57 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified