Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 4925 papers

Title	Date	Tasks	Status	Hype
EfficientLLM: Efficiency in Large Language Models	May 20, 2025	Mixture-of-ExpertsQuantization	—Unverified	0
Through a Compressed Lens: Investigating the Impact of Quantization on LLM Explainability and Interpretability	May 20, 2025	counterfactualMemorization	—Unverified	0
Scaling Law for Quantization-Aware Training	May 20, 2025	Quantization	CodeCode Available	4
Dual Precision Quantization for Efficient and Accurate Deep Neural Networks Inference	May 20, 2025	Quantizationspeech-recognition	CodeCode Available	0
Layer-wise Quantization for Quantized Optimistic Dual Averaging	May 20, 2025	Quantization	—Unverified	0
Optimizing Binary and Ternary Neural Network Inference on RRAM Crossbars using CIM-Explorer	May 20, 2025	Quantization	CodeCode Available	1
QUADS: QUAntized Distillation Framework for Efficient Speech Language Understanding	May 19, 2025	QuantizationSpoken Language Understanding	CodeCode Available	0
An Overview of Arithmetic Adaptations for Inference of Convolutional Neural Networks on Re-configurable Hardware	May 19, 2025	Quantization	CodeCode Available	0
GANCompress: GAN-Enhanced Neural Image Compression with Binary Spherical Quantization	May 19, 2025	Computational EfficiencyImage Compression	—Unverified	0
Efficient Speech Language Modeling via Energy Distance in Continuous Latent Space	May 19, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
Deep Unfolding with Kernel-based Quantization in MIMO Detection	May 19, 2025	Density EstimationEdge-computing	—Unverified	0
UniHM: Universal Human Motion Generation with Object Interactions in Indoor Scenes	May 19, 2025	Human-Object Interaction DetectionMotion Generation	—Unverified	0
Fine-tuning Quantized Neural Networks with Zeroth-order Optimization	May 19, 2025	GPUQuantization	CodeCode Available	1
Automatic mixed precision for optimizing gained time with constrained loss mean-squared-error based on model partition to sequential sub-graphs	May 19, 2025	QuantizationSensitivity	—Unverified	0
A3 : an Analytical Low-Rank Approximation Framework for Attention	May 19, 2025	Quantization	—Unverified	0
KVmix: Gradient-Based Layer Importance-Aware Mixed-Precision Quantization for KV Cache	May 18, 2025	Quantization	—Unverified	0
CALM: Co-evolution of Algorithms and Language Model for Automatic Heuristic Design	May 18, 2025	GPULanguage Modeling	—Unverified	0
PMQ-VE: Progressive Multi-Frame Quantization for Video Enhancement	May 18, 2025	QuantizationVideo Enhancement	CodeCode Available	0
Hyperbolic Residual Quantization: Discrete Representations for Data with Latent Hierarchies	May 18, 2025	Inductive BiasKnowledge Graphs	—Unverified	0
FedHQ: Hybrid Runtime Quantization for Federated Learning	May 17, 2025	Federated LearningQuantization	—Unverified	0
Qronos: Correcting the Past by Shaping the Future... in Post-Training Quantization	May 16, 2025	QuantizationText Generation	—Unverified	0
Benchmarking CFAR and CNN-based Peak Detection Algorithms in ISAC under Hardware Impairments	May 16, 2025	BenchmarkingIntegrated sensing and communication	—Unverified	0
Formal Uncertainty Propagation for Stochastic Dynamical Systems with Additive Noise	May 16, 2025	QuantizationStochastic Optimization	—Unverified	0
QVGen: Pushing the Limit of Quantized Video Generative Models	May 16, 2025	Quantization	—Unverified	0
MARRS: Masked Autoregressive Unit-based Reaction Synthesis	May 16, 2025	Motion GenerationQuantization	—Unverified	0
Gaussian Weight Sampling for Scalable, Efficient and Stable Pseudo-Quantization Training	May 16, 2025	GPUQuantization	—Unverified	0
Addition is almost all you need: Compressing neural networks with double binary factorization	May 16, 2025	AllBinarization	CodeCode Available	0
GenoArmory: A Unified Evaluation Framework for Adversarial Attacks on Genomic Foundation Models	May 16, 2025	Adversarial AttackAdversarial Defense	CodeCode Available	1
Accurate KV Cache Quantization with Outlier Tokens Tracing	May 16, 2025	Quantization	CodeCode Available	1
EA-3DGS: Efficient and Adaptive 3D Gaussians with Highly Enhanced Quality for outdoor scenes	May 16, 2025	3DGSNeRF	CodeCode Available	1
A probabilistic framework for dynamic quantization	May 15, 2025	Quantization	—Unverified	0
VQ-Logits: Compressing the Output Bottleneck of Large Language Models via Vector Quantized Logits	May 15, 2025	Language ModelingLanguage Modelling	—Unverified	0
TransPL: VQ-Code Transition Matrices for Pseudo-Labeling of Time Series Unsupervised Domain Adaptation	May 15, 2025	Domain AdaptationPseudo Label	CodeCode Available	0
Analog Foundation Models	May 14, 2025	4kQuantization	CodeCode Available	1
Zero-shot Quantization: A Comprehensive Survey	May 14, 2025	QuantizationSurvey	—Unverified	0
Efficient Mixed Precision Quantization in Graph Neural Networks	May 14, 2025	Graph ClassificationNode Classification	CodeCode Available	0
Resource-Efficient Language Models: Quantization for Fast and Accessible Inference	May 13, 2025	Quantization	—Unverified	0
Multi-Layer Hierarchical Federated Learning with Quantization	May 13, 2025	Federated LearningQuantization	—Unverified	0
Efficient ANN-SNN Conversion with Error Compensation Learning	May 12, 2025	Quantization	—Unverified	0
Cognitive Non-Coherent Jamming Techniques for Frequency Selective Attacks	May 12, 2025	Quantization	—Unverified	0
An Extra RMSNorm is All You Need for Fine Tuning to 1.58 Bits	May 12, 2025	AllKnowledge Distillation	—Unverified	0
QuantX: A Framework for Hardware-Aware Quantization of Generative AI Workloads	May 12, 2025	Quantization	—Unverified	0
Continuous Visual Autoregressive Generation via Score Maximization	May 12, 2025	Quantization	CodeCode Available	1
Bang for the Buck: Vector Search on Cloud CPUs	May 12, 2025	CPUQuantization	—Unverified	0
Private LoRA Fine-tuning of Open-Source LLMs with Homomorphic Encryption	May 12, 2025	GPUKnowledge Base Question Answering	—Unverified	0
Semantic Retention and Extreme Compression in LLMs: Can We Have Both?	May 12, 2025	Language ModelingLanguage Modelling	—Unverified	0
GuidedQuant: Large Language Model Quantization via Exploiting End Loss Guidance	May 11, 2025	Language ModelingLanguage Modelling	CodeCode Available	2
Improving Block-Wise LLM Quantization by 4-bit Block-Wise Optimal Float (BOF4): Analysis and Variations	May 10, 2025	Language ModelingLanguage Modelling	—Unverified	0
Challenging GPU Dominance: When CPUs Outperform for On-Device LLM Inference	May 9, 2025	CPUGPU	—Unverified	0
LightNobel: Improving Sequence Length Limitation in Protein Structure Prediction Model via Adaptive Activation Quantization	May 9, 2025	Protein FoldingProtein Structure Prediction	—Unverified	0

Show:10 25 50

← PrevPage 4 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified