Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4251–4300 of 4925 papers

Title	Date	Tasks	Status
Tiny Reinforcement Learning for Quadruped Locomotion using Decision Transformers	Feb 20, 2024	Imitation LearningQuantization	CodeCode Available
FEDZIP: A Compression Framework for Communication-Efficient Federated Learning	Feb 2, 2021	BIG-bench Machine LearningClustering	CodeCode Available
Distilling the Knowledge of Romanian BERTs Using Multiple Teachers	Dec 23, 2021	Dialect IdentificationGPU	CodeCode Available
Fed-QSSL: A Framework for Personalized Federated Learning under Bitwidth and Data Heterogeneity	Dec 20, 2023	Federated LearningPersonalized Federated Learning	CodeCode Available
Model Compression Techniques in Biometrics Applications: A Survey	Jan 18, 2024	FairnessKnowledge Distillation	CodeCode Available
Model compression via distillation and quantization	Feb 15, 2018	image-classificationmodel	CodeCode Available
Mixed-Precision Quantization and Parallel Implementation of Multispectral Riemannian Classification for Brain--Machine Interfaces	Feb 22, 2021	General ClassificationMotor Imagery	CodeCode Available
FTBNN: Rethinking Non-linearity for 1-bit CNNs and Going Beyond	Oct 19, 2020	Image ClassificationQuantization	CodeCode Available
Rotation Invariant Quantization for Model Compression	Mar 3, 2023	modelModel Compression	CodeCode Available
QPyTorch: A Low-Precision Arithmetic Simulation Framework	Oct 9, 2019	Quantization	CodeCode Available
Federated Learning via Plurality Vote	Oct 6, 2021	Federated LearningQuantization	CodeCode Available
Mixed Non-linear Quantization for Vision Transformers	Jul 26, 2024	Quantization	CodeCode Available
Mitigating the Impact of Outlier Channels for Language Model Quantization with Activation Regularization	Apr 4, 2024	GPULanguage Modeling	CodeCode Available
Routing-Guided Learned Product Quantization for Graph-Based Approximate Nearest Neighbor Search	Nov 30, 2023	Quantization	CodeCode Available
Stealthy Backdoors as Compression Artifacts	Apr 30, 2021	Backdoor AttackModel Compression	CodeCode Available
Modulated Diffusion: Accelerating Generative Modeling with Modulated Quantization	Jun 18, 2025	Quantization	CodeCode Available
Distillation Improves Visual Place Recognition for Low Quality Images	Oct 10, 2023	Knowledge DistillationQuantization	CodeCode Available
Modular Quantization-Aware Training for 6D Object Pose Estimation	Mar 12, 2023	6D Pose Estimation6D Pose Estimation using RGB	CodeCode Available
Mitigating Quantization Errors Due to Activation Spikes in GLU-Based LLMs	May 23, 2024	Quantization	CodeCode Available
Federated learning compression designed for lightweight communications	Oct 23, 2023	Cloud ComputingFederated Learning	CodeCode Available
Compressed Object Detection	Feb 4, 2021	Model CompressionObject	CodeCode Available
Step by Step Loss Goes Very Far: Multi-Step Quantization for Adversarial Text Attacks	Feb 10, 2023	Adversarial TextQuantization	CodeCode Available
Disentanglement with Factor Quantized Variational Autoencoders	Sep 23, 2024	DisentanglementInductive Bias	CodeCode Available
Q-S5: Towards Quantized State Space Models	Jun 13, 2024	Computational EfficiencyQuantization	CodeCode Available
Monocular Depth Estimation with Hierarchical Fusion of Dilated CNNs and Soft-Weighted-Sum Inference	Aug 2, 2017	Depth EstimationMonocular Depth Estimation	CodeCode Available
Accelerating PoT Quantization on Edge Devices	Sep 30, 2024	CPUQuantization	CodeCode Available
Federated Classification in Hyperbolic Spaces via Secure Aggregation of Convex Hulls	Aug 14, 2023	Federated Learninggraph partitioning	CodeCode Available
QSGD: Communication-Efficient SGD via Gradient Quantization and Encoding	Oct 7, 2016	image-classificationImage Classification	CodeCode Available
StereoNet: Guided Hierarchical Refinement for Real-Time Edge-Aware Depth Prediction	Jul 24, 2018	Depth EstimationDepth Prediction	CodeCode Available
MorpheusNet: Resource efficient sleep stage classifier for embedded on-line systems	Jan 14, 2024	Quantization	CodeCode Available
TinySubNets: An efficient and low capacity continual learning strategy	Dec 14, 2024	Continual LearningQuantization	CodeCode Available
Additive Powers-of-Two Quantization: An Efficient Non-uniform Discretization for Neural Networks	Sep 28, 2019	Computational EfficiencyQuantization	CodeCode Available
MotionAura: Generating High-Quality and Motion Consistent Videos using Discrete Diffusion	Oct 10, 2024	Denoisingparameter-efficient fine-tuning	CodeCode Available
AlignedKV: Reducing Memory Access of KV-Cache with Precision-Aligned Quantization	Sep 25, 2024	Quantization	CodeCode Available
Mirror Descent View for Neural Network Quantization	Oct 18, 2019	Quantizationvalid	CodeCode Available
MINT: Multiplier-less INTeger Quantization for Energy Efficient Spiking Neural Networks	May 16, 2023	Quantization	CodeCode Available
Minimize Quantization Output Error with Bias Compensation	Apr 2, 2024	Quantization	CodeCode Available
Qsparse-local-SGD: Distributed SGD with Quantization, Sparsification and Local Computations	Dec 1, 2019	Distributed OptimizationQuantization	CodeCode Available
Minimal Random Code Learning: Getting Bits Back from Compressed Model Parameters	Sep 30, 2018	Neural Network CompressionQuantization	CodeCode Available
TreeLUT: An Efficient Alternative to Deep Neural Networks for Inference Acceleration Using Gradient Boosted Decision Trees	Jan 2, 2025	Quantization	CodeCode Available
MetaAug: Meta-Data Augmentation for Post-Training Quantization	Jul 20, 2024	Data AugmentationMeta-Learning	CodeCode Available
BinaryRelax: A Relaxation Approach For Training Deep Neural Networks With Quantized Weights	Jan 19, 2018	Quantization	CodeCode Available
Stochastic Monkeys at Play: Random Augmentations Cheaply Break LLM Safety Alignment	Nov 5, 2024	QuantizationSafety Alignment	CodeCode Available
Feature Distillation: DNN-Oriented JPEG Compression Against Adversarial Examples	Mar 14, 2018	ClassificationGeneral Classification	CodeCode Available
FDDH: Fast Discriminative Discrete Hashing for Large-Scale Cross-Modal Retrieval	May 15, 2021	Cross-Modal RetrievalQuantization	CodeCode Available
AMED: Automatic Mixed-Precision Quantization for Edge Devices	May 30, 2022	Quantization	CodeCode Available
Discrete representations in neural models of spoken language	May 12, 2021	AttributeQuantization	CodeCode Available
QTTNet: Quantized Tensor Train Neural Networks for 3D Object and Video Recognition.	Sep 20, 2021	QuantizationVideo Recognition	CodeCode Available
GLAD: Improving Latent Graph Generative Modeling with Simple Quantization	Mar 25, 2024	Quantization	CodeCode Available
Discrete Factorization Machines for Fast Feature-based Recommendation	May 6, 2018	BinarizationQuantization	CodeCode Available

Show:10 25 50

← PrevPage 86 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified