Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2201–2250 of 4925 papers

Title	Date	Tasks	Status	Hype
Reducing Communication for Split Learning by Randomized Top-k Sparsification	May 29, 2023	Federated LearningQuantization	—Unverified	0
SlimFit: Memory-Efficient Fine-Tuning of Transformer-based Models Using Training Dynamics	May 29, 2023	GPUQuantization	—Unverified	0
DeCoR: Defy Knowledge Forgetting by Predicting Earlier Audio Codes	May 29, 2023	Acoustic Scene ClassificationContinual Learning	—Unverified	0
LLM-QAT: Data-Free Quantization Aware Training for Large Language Models	May 29, 2023	Data Free QuantizationQuantization	CodeCode Available	3
BRICS: Bi-level feature Representation of Image CollectionS	May 29, 2023	DecoderImage Generation	—Unverified	0
A Transfer Learning and Explainable Solution to Detect mpox from Smartphones images	May 29, 2023	image-classificationImage Classification	CodeCode Available	0
Reversible Quantization Index Modulation for Static Deep Neural Network Watermarking	May 29, 2023	Quantization	—Unverified	0
Disentanglement via Latent Quantization	May 28, 2023	DisentanglementInductive Bias	CodeCode Available	1
Examining the Role and Limits of Batchnorm Optimization to Mitigate Diverse Hardware-noise in In-memory Computing	May 28, 2023	Quantization	—Unverified	0
Efficient Storage of Fine-Tuned Models via Low-Rank Approximation of Weight Residuals	May 28, 2023	Quantization	—Unverified	0
Scissorhands: Exploiting the Persistence of Importance Hypothesis for LLM KV Cache Compression at Test Time	May 26, 2023	Quantization	—Unverified	0
2-bit Conformer quantization for automatic speech recognition	May 26, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified	0
PQA: Exploring the Potential of Product Quantization in DNN Hardware Acceleration	May 25, 2023	Quantization	CodeCode Available	0
NVTC: Nonlinear Vector Transform Coding	May 25, 2023	Image CompressionQuantization	CodeCode Available	1
KeyPosS: Plug-and-Play Facial Landmark Detection through GPS-Inspired True-Range Multilateration	May 25, 2023	BenchmarkingFace Recognition	CodeCode Available	1
RAND: Robustness Aware Norm Decay For Quantized Seq2seq Models	May 24, 2023	Machine TranslationModel Compression	—Unverified	0
Just CHOP: Embarrassingly Simple LLM Compression	May 24, 2023	Knowledge DistillationLanguage Modeling	—Unverified	0
BinaryViT: Towards Efficient and Accurate Binary Vision Transformers	May 24, 2023	BinarizationQuantization	—Unverified	0
QLoRA: Efficient Finetuning of Quantized LLMs	May 23, 2023	ChatbotGPU	CodeCode Available	6
Not All Image Regions Matter: Masked Vector Quantization for Autoregressive Image Generation	May 23, 2023	AllImage Generation	CodeCode Available	1
Adversarial Defenses via Vector Quantization	May 23, 2023	Quantization	—Unverified	0
Downlink Clustering-Based Scheduling of IRS-Assisted Communications With Reconfiguration Constraints	May 23, 2023	ClusteringQuantization	—Unverified	0
Memory-Efficient Fine-Tuning of Compressed Large Language Models via sub-4-bit Integer Quantization	May 23, 2023	In-Context LearningLanguage Modeling	—Unverified	0
Combining Multi-Objective Bayesian Optimization with Reinforcement Learning for TinyML	May 23, 2023	Bayesian OptimizationHyperparameter Optimization	—Unverified	0
Differential Privacy with Random Projections and Sign Random Projections	May 22, 2023	Information RetrievalQuantization	—Unverified	0
TinyissimoYOLO: A Quantized, Low-Memory Footprint, TinyML Object Detection Network for Low Power Microcontrollers	May 22, 2023	Objectobject-detection	—Unverified	0
Digital-SC: Digital Semantic Communication with Adaptive Network Split and Learned Non-Linear Quantization	May 22, 2023	image-classificationImage Classification	—Unverified	0
TSPTQ-ViT: Two-scaled post-training quantization for vision transformer	May 22, 2023	Quantization	—Unverified	0
Response Length Perception and Sequence Scheduling: An LLM-Empowered LLM Inference Pipeline	May 22, 2023	QuantizationScheduling	CodeCode Available	1
Revisiting Data Augmentation in Model Compression: An Empirical and Comprehensive Study	May 22, 2023	Data AugmentationKnowledge Distillation	—Unverified	0
FAQ: Mitigating the Impact of Faults in the Weight Memory of DNN Accelerators through Fault-Aware Quantization	May 21, 2023	Quantization	—Unverified	0
Atomic Anatomy of Low-Inertia Power Systems	May 21, 2023	AnatomyQuantization	—Unverified	0
Integer or Floating Point? New Outlooks for Low-Bit Quantization on Large Language Models	May 21, 2023	GPUQuantization	—Unverified	0
Bi-ViT: Pushing the Limit of Vision Transformer Quantization	May 21, 2023	BinarizationQuantization	—Unverified	0
Two-Bit RIS-Aided Communications at 3.5GHz: Some Insights from the Measurement Results Under Multiple Practical Scenes	May 19, 2023	Intelligent CommunicationQuantization	—Unverified	0
Towards Accurate Image Coding: Improved Autoregressive Image Generation with Dynamic Vector Quantization	May 19, 2023	Image GenerationPosition	CodeCode Available	1
ReTAG: Reasoning Aware Table to Analytic Text Generation	May 19, 2023	Data-to-Text GenerationDescriptive	—Unverified	0
PTQD: Accurate Post-Training Quantization for Diffusion Models	May 18, 2023	DenoisingImage Generation	CodeCode Available	1
Boost Vision Transformer with GPU-Friendly Sparsity and Quantization	May 18, 2023	BenchmarkingGPU	—Unverified	0
QPGesture: Quantization-Based and Phase-Guided Motion Matching for Natural Speech-Driven Gesture Generation	May 18, 2023	Gesture GenerationQuantization	CodeCode Available	1
Q-SHED: Distributed Optimization at the Edge via Hessian Eigenvectors Quantization	May 18, 2023	Distributed OptimizationQuantization	—Unverified	0
DQ-Whisper: Joint Distillation and Quantization for Efficient Multilingual Speech Recognition	May 18, 2023	Knowledge DistillationQuantization	—Unverified	0
Compress, Then Prompt: Improving Accuracy-Efficiency Trade-off of LLM Inference with Transferable Prompt	May 17, 2023	GPUModel Compression	—Unverified	0
MINT: Multiplier-less INTeger Quantization for Energy Efficient Spiking Neural Networks	May 16, 2023	Quantization	CodeCode Available	0
Component Training of Turbo Autoencoders	May 16, 2023	Quantization	—Unverified	0
Fast Inference of Tree Ensembles on ARM Devices	May 15, 2023	Quantization	—Unverified	0
Task-Oriented Communication Design at Scale	May 15, 2023	QuantizationReinforcement Learning (RL)	—Unverified	0
Designing Discontinuities	May 15, 2023	EconometricsQuantization	—Unverified	0
Straightening Out the Straight-Through Estimator: Overcoming Optimization Challenges in Vector Quantized Networks	May 15, 2023	image-classificationImage Classification	—Unverified	0
Federated TD Learning over Finite-Rate Erasure Channels: Linear Speedup under Markovian Sampling	May 14, 2023	Distributed OptimizationFederated Learning	—Unverified	0

Show:10 25 50

← PrevPage 45 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified