Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4301–4350 of 4925 papers

Title	Date	Tasks	Status
QUAD: Quantization and Parameter-Efficient Tuning of LLM with Activation Decomposition	Mar 25, 2025	parameter-efficient fine-tuningQuantization	CodeCode Available
QUADS: QUAntized Distillation Framework for Efficient Speech Language Understanding	May 19, 2025	QuantizationSpoken Language Understanding	CodeCode Available
Fast Supervised Discrete Hashing and its Analysis	Nov 30, 2016	Image RetrievalQuantization	CodeCode Available
Multi-Class Uncertainty Calibration via Mutual Information Maximization-based Binning	Jun 23, 2020	Quantization	CodeCode Available
Multi-Excitation Projective Simulation with a Many-Body Physics Inspired Inductive Bias	Feb 15, 2024	Explainable artificial intelligenceExplainable Artificial Intelligence (XAI)	CodeCode Available
Vector Quantized Multi-modal Guidance for Alzheimer’s Disease Diagnosis Based on Feature Imputation	Oct 8, 2023	ImputationQuantization	CodeCode Available
TREND: Transferability based Robust ENsemble Design	Aug 4, 2020	Adversarial RobustnessQuantization	CodeCode Available
Binarized Knowledge Graph Embeddings	Feb 8, 2019	Knowledge Graph CompletionKnowledge Graph Embeddings	CodeCode Available
Same, Same But Different - Recovering Neural Network Quantization Error Through Weight Factorization	Feb 5, 2019	Network PruningQuantization	CodeCode Available
Bimodal Distributed Binarized Neural Networks	Apr 5, 2022	BinarizationQuantization	CodeCode Available
Fast Private Kernel Density Estimation via Locality Sensitive Quantization	Jul 4, 2023	Density EstimationQuantization	CodeCode Available
Fast High-Dimensional Bilateral and Nonlocal Means Filtering	Nov 6, 2018	ClusteringQuantization	CodeCode Available
Merge-Friendly Post-Training Quantization for Multi-Target Domain Adaptation	May 29, 2025	Domain AdaptationMulti-target Domain Adaptation	CodeCode Available
Memory-Driven Mixed Low Precision Quantization For Enabling Deep Network Inference On Microcontrollers	May 30, 2019	Quantization	CodeCode Available
StoX-Net: Stochastic Processing of Partial Sums for Efficient In-Memory Computing DNN Accelerators	Jul 17, 2024	Quantization	CodeCode Available
BiFeat: Supercharge GNN Training via Graph Feature Quantization	Jul 29, 2022	GPUQuantization	CodeCode Available
Faster Binary Embeddings for Preserving Euclidean Distances	Oct 1, 2020	Quantization	CodeCode Available
QuantAttack: Exploiting Dynamic Quantization to Attack Vision Transformers	Dec 3, 2023	Quantization	CodeCode Available
Fast and Slow Gradient Approximation for Binary Neural Network Optimization	Dec 16, 2024	Quantization	CodeCode Available
Beyond Product Quantization: Deep Progressive Quantization for Image Retrieval	Jun 16, 2019	Image RetrievalQuantization	CodeCode Available
Fast Adversarial Robustness Certification of Nearest Prototype Classifiers for Arbitrary Seminorms	Dec 1, 2020	Adversarial RobustnessQuantization	CodeCode Available
Accelerating Generalized Linear Models with MLWeaving: A One-Size-Fits-All System for Any-precision Learning (Technical Report)	Mar 8, 2019	AllCPU	CodeCode Available
Beyond Perplexity: Multi-dimensional Safety Evaluation of LLM Compression	Jul 6, 2024	Language ModelingLanguage Modelling	CodeCode Available
Weightless: Lossy Weight Encoding For Deep Neural Network Compression	Nov 13, 2017	Model CompressionNeural Network Compression	CodeCode Available
Unsupervised Neural Quantization for Compressed-Domain Similarity Search	Aug 11, 2019	Image RetrievalQuantization	CodeCode Available
Scalable Methods for 8-bit Training of Neural Networks	May 25, 2018	Quantization	CodeCode Available
Benchmarking Post-Training Quantization in LLMs: Comprehensive Taxonomy, Unified Evaluation, and Comparative Analysis	Feb 18, 2025	BenchmarkingMamba	CodeCode Available
Quantitative Analysis of Performance Drop in DeepSeek Model Quantization	May 5, 2025	GPUQuantization	CodeCode Available
Megapixel Image Generation with Step-Unrolled Denoising Autoencoders	Jun 24, 2022	DenoisingGPU	CodeCode Available
Compressed 3D Gaussian Splatting for Accelerated Novel View Synthesis	Nov 17, 2023	GPUNovel View Synthesis	CodeCode Available
Trio-ViT: Post-Training Quantization and Acceleration for Softmax-Free Efficient Vision Transformer	May 6, 2024	Efficient ViTsModel Compression	CodeCode Available
Fast Adjustable Threshold For Uniform Neural Network Quantization (Winning solution of LPIRC-II)	Dec 19, 2018	Quantization	CodeCode Available
FALCON: Feature-Label Constrained Graph Net Collapse for Memory Efficient GNNs	Dec 27, 2023	BenchmarkingGPU	CodeCode Available
Scalable Recognition with a Vocabulary Tree	Jun 22, 2006	QuantizationRetrieval	CodeCode Available
McQueen : Mixed Precision Quantization of Early Exit Networks	Nov 20, 2023	Quantization	CodeCode Available
Make RepVGG Greater Again: A Quantization-aware Approach	Dec 3, 2022	QuantizationSemantic Segmentation	CodeCode Available
Quantization and Deployment of Deep Neural Networks on Microcontrollers	May 27, 2021	Activity RecognitionHuman Activity Recognition	CodeCode Available
Toward Accurate Post-Training Quantization for Image Super Resolution	Jan 1, 2023	Image Super-ResolutionQuantization	CodeCode Available
Maestro: Uncovering Low-Rank Structures via Trainable Decomposition	Aug 28, 2023	Low-rank compressionQuantization	CodeCode Available
Machine Learning at the Wireless Edge: Distributed Stochastic Gradient Descent Over-the-Air	Jan 3, 2019	BIG-bench Machine LearningQuantization	CodeCode Available
FairGLVQ: Fairness in Partition-Based Classification	Oct 16, 2024	ClassificationFairness	CodeCode Available
Unsupervised Panoptic Interpretation of Latent Spaces in GANs Using Space-Filling Vector Quantization	Oct 27, 2024	Data AugmentationQuantization	CodeCode Available
Scalable Verification of Quantized Neural Networks (Technical Report)	Dec 15, 2020	Computational EfficiencyQuantization	CodeCode Available
Natural Quantization of Neural Networks	Mar 19, 2025	Quantization	CodeCode Available
LVPNet: A Latent-variable-based Prediction-driven End-to-end Framework for Lossless Compression of Medical Images	Jun 22, 2025	Image CompressionImage Segmentation	CodeCode Available
Structured Pruning and Quantization for Learned Image Compression	Jun 2, 2025	image-classificationImage Classification	CodeCode Available
Unsupervised Person Re-identification via Softened Similarity Learning	Apr 7, 2020	ClusteringGeneral Classification	CodeCode Available
An Overview of Arithmetic Adaptations for Inference of Convolutional Neural Networks on Re-configurable Hardware	May 19, 2025	Quantization	CodeCode Available
LVLM-Compress-Bench: Benchmarking the Broader Impact of Large Vision-Language Model Compression	Mar 6, 2025	BenchmarkingCommon Sense Reasoning	CodeCode Available
Quantization-aware Interval Bound Propagation for Training Certifiably Robust Quantized Neural Networks	Nov 29, 2022	Adversarial RobustnessGPU	CodeCode Available

Show:10 25 50

← PrevPage 87 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified