Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2601–2650 of 4925 papers

Title	Date	Tasks	Status
Implementation of a framework for deploying AI inference engines in FPGAs	May 30, 2023	QuantizationResynthesis	—Unverified
Low Precision Quantization-aware Training in Spiking Neural Networks with Differentiable Quantization Function	May 30, 2023	Edge-computingQuantization	—Unverified
Intriguing Properties of Quantization at Scale	May 30, 2023	Quantization	—Unverified
Stochastic Gradient Langevin Dynamics Based on Quantization with Increasing Resolution	May 30, 2023	Quantization	—Unverified
DeCoR: Defy Knowledge Forgetting by Predicting Earlier Audio Codes	May 29, 2023	Acoustic Scene ClassificationContinual Learning	—Unverified
Global-QSGD: Practical Floatless Quantization for Distributed Learning with Theoretical Guarantees	May 29, 2023	Quantization	—Unverified
Reducing Communication for Split Learning by Randomized Top-k Sparsification	May 29, 2023	Federated LearningQuantization	—Unverified
BRICS: Bi-level feature Representation of Image CollectionS	May 29, 2023	DecoderImage Generation	—Unverified
SlimFit: Memory-Efficient Fine-Tuning of Transformer-based Models Using Training Dynamics	May 29, 2023	GPUQuantization	—Unverified
Reversible Quantization Index Modulation for Static Deep Neural Network Watermarking	May 29, 2023	Quantization	—Unverified
A Transfer Learning and Explainable Solution to Detect mpox from Smartphones images	May 29, 2023	image-classificationImage Classification	CodeCode Available
Efficient Storage of Fine-Tuned Models via Low-Rank Approximation of Weight Residuals	May 28, 2023	Quantization	—Unverified
Examining the Role and Limits of Batchnorm Optimization to Mitigate Diverse Hardware-noise in In-memory Computing	May 28, 2023	Quantization	—Unverified
2-bit Conformer quantization for automatic speech recognition	May 26, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Scissorhands: Exploiting the Persistence of Importance Hypothesis for LLM KV Cache Compression at Test Time	May 26, 2023	Quantization	—Unverified
PQA: Exploring the Potential of Product Quantization in DNN Hardware Acceleration	May 25, 2023	Quantization	CodeCode Available
BinaryViT: Towards Efficient and Accurate Binary Vision Transformers	May 24, 2023	BinarizationQuantization	—Unverified
Just CHOP: Embarrassingly Simple LLM Compression	May 24, 2023	Knowledge DistillationLanguage Modeling	—Unverified
RAND: Robustness Aware Norm Decay For Quantized Seq2seq Models	May 24, 2023	Machine TranslationModel Compression	—Unverified
Downlink Clustering-Based Scheduling of IRS-Assisted Communications With Reconfiguration Constraints	May 23, 2023	ClusteringQuantization	—Unverified
Memory-Efficient Fine-Tuning of Compressed Large Language Models via sub-4-bit Integer Quantization	May 23, 2023	In-Context LearningLanguage Modeling	—Unverified
Combining Multi-Objective Bayesian Optimization with Reinforcement Learning for TinyML	May 23, 2023	Bayesian OptimizationHyperparameter Optimization	—Unverified
Adversarial Defenses via Vector Quantization	May 23, 2023	Quantization	—Unverified
Differential Privacy with Random Projections and Sign Random Projections	May 22, 2023	Information RetrievalQuantization	—Unverified
TSPTQ-ViT: Two-scaled post-training quantization for vision transformer	May 22, 2023	Quantization	—Unverified
Digital-SC: Digital Semantic Communication with Adaptive Network Split and Learned Non-Linear Quantization	May 22, 2023	image-classificationImage Classification	—Unverified
TinyissimoYOLO: A Quantized, Low-Memory Footprint, TinyML Object Detection Network for Low Power Microcontrollers	May 22, 2023	Objectobject-detection	—Unverified
Revisiting Data Augmentation in Model Compression: An Empirical and Comprehensive Study	May 22, 2023	Data AugmentationKnowledge Distillation	—Unverified
Bi-ViT: Pushing the Limit of Vision Transformer Quantization	May 21, 2023	BinarizationQuantization	—Unverified
FAQ: Mitigating the Impact of Faults in the Weight Memory of DNN Accelerators through Fault-Aware Quantization	May 21, 2023	Quantization	—Unverified
Integer or Floating Point? New Outlooks for Low-Bit Quantization on Large Language Models	May 21, 2023	GPUQuantization	—Unverified
Atomic Anatomy of Low-Inertia Power Systems	May 21, 2023	AnatomyQuantization	—Unverified
ReTAG: Reasoning Aware Table to Analytic Text Generation	May 19, 2023	Data-to-Text GenerationDescriptive	—Unverified
Two-Bit RIS-Aided Communications at 3.5GHz: Some Insights from the Measurement Results Under Multiple Practical Scenes	May 19, 2023	Intelligent CommunicationQuantization	—Unverified
Boost Vision Transformer with GPU-Friendly Sparsity and Quantization	May 18, 2023	BenchmarkingGPU	—Unverified
DQ-Whisper: Joint Distillation and Quantization for Efficient Multilingual Speech Recognition	May 18, 2023	Knowledge DistillationQuantization	—Unverified
Q-SHED: Distributed Optimization at the Edge via Hessian Eigenvectors Quantization	May 18, 2023	Distributed OptimizationQuantization	—Unverified
Compress, Then Prompt: Improving Accuracy-Efficiency Trade-off of LLM Inference with Transferable Prompt	May 17, 2023	GPUModel Compression	—Unverified
Component Training of Turbo Autoencoders	May 16, 2023	Quantization	—Unverified
MINT: Multiplier-less INTeger Quantization for Energy Efficient Spiking Neural Networks	May 16, 2023	Quantization	CodeCode Available
Task-Oriented Communication Design at Scale	May 15, 2023	QuantizationReinforcement Learning (RL)	—Unverified
Straightening Out the Straight-Through Estimator: Overcoming Optimization Challenges in Vector Quantized Networks	May 15, 2023	image-classificationImage Classification	—Unverified
Fast Inference of Tree Ensembles on ARM Devices	May 15, 2023	Quantization	—Unverified
Designing Discontinuities	May 15, 2023	EconometricsQuantization	—Unverified
Federated TD Learning over Finite-Rate Erasure Channels: Linear Speedup under Markovian Sampling	May 14, 2023	Distributed OptimizationFederated Learning	—Unverified
Analyzing Compression Techniques for Computer Vision	May 14, 2023	Knowledge DistillationQuantization	—Unverified
Quantization in Spiking Neural Networks	May 13, 2023	Quantization	CodeCode Available
GSB: Group Superposition Binarization for Vision Transformer with Limited Training Samples	May 13, 2023	BinarizationKnowledge Distillation	CodeCode Available
Accelerator-Aware Training for Transducer-Based Speech Recognition	May 12, 2023	CPUQuantization	—Unverified
Speaker Diaphragm Excursion Prediction: deep attention and online adaptation	May 11, 2023	Deep AttentionQuantization	—Unverified

Show:10 25 50

← PrevPage 53 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified