Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–175 of 4925 papers

Title	Date	Tasks	Status	Hype
Layer-wise Quantization for Quantized Optimistic Dual Averaging	May 20, 2025	Quantization	—Unverified	0
Dual Precision Quantization for Efficient and Accurate Deep Neural Networks Inference	May 20, 2025	Quantizationspeech-recognition	—Unverified	0
EfficientLLM: Efficiency in Large Language Models	May 20, 2025	Mixture-of-ExpertsQuantization	—Unverified	0
Through a Compressed Lens: Investigating the Impact of Quantization on LLM Explainability and Interpretability	May 20, 2025	counterfactualMemorization	—Unverified	0
Scaling Law for Quantization-Aware Training	May 20, 2025	Quantization	CodeCode Available	4
Optimizing Binary and Ternary Neural Network Inference on RRAM Crossbars using CIM-Explorer	May 20, 2025	Quantization	CodeCode Available	1
QUADS: QUAntized Distillation Framework for Efficient Speech Language Understanding	May 19, 2025	QuantizationSpoken Language Understanding	CodeCode Available	0
An Overview of Arithmetic Adaptations for Inference of Convolutional Neural Networks on Re-configurable Hardware	May 19, 2025	Quantization	CodeCode Available	0
GANCompress: GAN-Enhanced Neural Image Compression with Binary Spherical Quantization	May 19, 2025	Computational EfficiencyImage Compression	—Unverified	0
Efficient Speech Language Modeling via Energy Distance in Continuous Latent Space	May 19, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
Deep Unfolding with Kernel-based Quantization in MIMO Detection	May 19, 2025	Density EstimationEdge-computing	—Unverified	0
Automatic mixed precision for optimizing gained time with constrained loss mean-squared-error based on model partition to sequential sub-graphs	May 19, 2025	QuantizationSensitivity	—Unverified	0
Fine-tuning Quantized Neural Networks with Zeroth-order Optimization	May 19, 2025	GPUQuantization	CodeCode Available	1
UniHM: Universal Human Motion Generation with Object Interactions in Indoor Scenes	May 19, 2025	Human-Object Interaction DetectionMotion Generation	—Unverified	0
A3 : an Analytical Low-Rank Approximation Framework for Attention	May 19, 2025	Quantization	—Unverified	0
KVmix: Gradient-Based Layer Importance-Aware Mixed-Precision Quantization for KV Cache	May 18, 2025	Quantization	—Unverified	0
CALM: Co-evolution of Algorithms and Language Model for Automatic Heuristic Design	May 18, 2025	GPULanguage Modeling	—Unverified	0
PMQ-VE: Progressive Multi-Frame Quantization for Video Enhancement	May 18, 2025	QuantizationVideo Enhancement	CodeCode Available	0
Hyperbolic Residual Quantization: Discrete Representations for Data with Latent Hierarchies	May 18, 2025	Inductive BiasKnowledge Graphs	—Unverified	0
FedHQ: Hybrid Runtime Quantization for Federated Learning	May 17, 2025	Federated LearningQuantization	—Unverified	0
Benchmarking CFAR and CNN-based Peak Detection Algorithms in ISAC under Hardware Impairments	May 16, 2025	BenchmarkingIntegrated sensing and communication	—Unverified	0
Qronos: Correcting the Past by Shaping the Future... in Post-Training Quantization	May 16, 2025	QuantizationText Generation	—Unverified	0
Formal Uncertainty Propagation for Stochastic Dynamical Systems with Additive Noise	May 16, 2025	QuantizationStochastic Optimization	—Unverified	0
QVGen: Pushing the Limit of Quantized Video Generative Models	May 16, 2025	Quantization	—Unverified	0
MARRS: Masked Autoregressive Unit-based Reaction Synthesis	May 16, 2025	Motion GenerationQuantization	—Unverified	0

Show:10 25 50

← PrevPage 7 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified