Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1001–1050 of 4925 papers

Title	Date	Tasks	Status
NeUQI: Near-Optimal Uniform Quantization Parameter Initialization	May 23, 2025	Quantization	CodeCode Available
NSNQuant: A Double Normalization Approach for Calibration-Free Low-Bit Vector Quantization of KV Cache	May 23, 2025	Language ModelingLanguage Modelling	—Unverified
Task Specific Pruning with LLM-Sieve: How Many Parameters Does Your Task Really Need?	May 23, 2025	Medical Question AnsweringQuantization	—Unverified
Slot-MLLM: Object-Centric Visual Tokenization for Multimodal LLM	May 23, 2025	Quantization	—Unverified
Beyond Discreteness: Finite-Sample Analysis of Straight-Through Estimator for Quantization	May 23, 2025	compressed sensingQuantization	—Unverified
NQKV: A KV Cache Quantization Scheme Based on Normal Distribution Characteristics	May 22, 2025	Quantization	—Unverified
DuFFin: A Dual-Level Fingerprinting Framework for LLMs IP Protection	May 22, 2025	QuantizationSafety Alignment	CodeCode Available
FPQVAR: Floating Point Quantization for Visual Autoregressive Model with FPGA Hardware Co-design	May 22, 2025	GPUImage Generation	CodeCode Available
Is Quantum Optimization Ready? An Effort Towards Neural Network Compression using Adiabatic Quantum Computing	May 22, 2025	Model CompressionNeural Network Compression	—Unverified
Segmentation-Variant Codebooks for Preservation of Paralinguistic and Prosodic Information	May 21, 2025	Language ModelingLanguage Modelling	—Unverified
Harnessing Large Language Models Locally: Empirical Results and Implications for AI PC	May 21, 2025	CPUQuantization	CodeCode Available
InTreeger: An End-to-End Framework for Integer-Only Decision Tree Inference	May 21, 2025	Edge-computingQuantization	—Unverified
Is (Selective) Round-To-Nearest Quantization All You Need?	May 21, 2025	AllQuantization	—Unverified
Rate-Distortion Optimization with Non-Reference Metrics for UGC Compression	May 21, 2025	Quantization	—Unverified
EfficientLLM: Efficiency in Large Language Models	May 20, 2025	Mixture-of-ExpertsQuantization	—Unverified
Layer-wise Quantization for Quantized Optimistic Dual Averaging	May 20, 2025	Quantization	—Unverified
Dual Precision Quantization for Efficient and Accurate Deep Neural Networks Inference	May 20, 2025	Quantizationspeech-recognition	—Unverified
Through a Compressed Lens: Investigating the Impact of Quantization on LLM Explainability and Interpretability	May 20, 2025	counterfactualMemorization	—Unverified
Deep Unfolding with Kernel-based Quantization in MIMO Detection	May 19, 2025	Density EstimationEdge-computing	—Unverified
QUADS: QUAntized Distillation Framework for Efficient Speech Language Understanding	May 19, 2025	QuantizationSpoken Language Understanding	CodeCode Available
An Overview of Arithmetic Adaptations for Inference of Convolutional Neural Networks on Re-configurable Hardware	May 19, 2025	Quantization	CodeCode Available
UniHM: Universal Human Motion Generation with Object Interactions in Indoor Scenes	May 19, 2025	Human-Object Interaction DetectionMotion Generation	—Unverified
GANCompress: GAN-Enhanced Neural Image Compression with Binary Spherical Quantization	May 19, 2025	Computational EfficiencyImage Compression	—Unverified
A3 : an Analytical Low-Rank Approximation Framework for Attention	May 19, 2025	Quantization	—Unverified
Automatic mixed precision for optimizing gained time with constrained loss mean-squared-error based on model partition to sequential sub-graphs	May 19, 2025	QuantizationSensitivity	—Unverified
KVmix: Gradient-Based Layer Importance-Aware Mixed-Precision Quantization for KV Cache	May 18, 2025	Quantization	—Unverified
Hyperbolic Residual Quantization: Discrete Representations for Data with Latent Hierarchies	May 18, 2025	Inductive BiasKnowledge Graphs	—Unverified
CALM: Co-evolution of Algorithms and Language Model for Automatic Heuristic Design	May 18, 2025	GPULanguage Modeling	—Unverified
PMQ-VE: Progressive Multi-Frame Quantization for Video Enhancement	May 18, 2025	QuantizationVideo Enhancement	CodeCode Available
FedHQ: Hybrid Runtime Quantization for Federated Learning	May 17, 2025	Federated LearningQuantization	—Unverified
QVGen: Pushing the Limit of Quantized Video Generative Models	May 16, 2025	Quantization	—Unverified
MARRS: Masked Autoregressive Unit-based Reaction Synthesis	May 16, 2025	Motion GenerationQuantization	—Unverified
Gaussian Weight Sampling for Scalable, Efficient and Stable Pseudo-Quantization Training	May 16, 2025	GPUQuantization	—Unverified
Benchmarking CFAR and CNN-based Peak Detection Algorithms in ISAC under Hardware Impairments	May 16, 2025	BenchmarkingIntegrated sensing and communication	—Unverified
Addition is almost all you need: Compressing neural networks with double binary factorization	May 16, 2025	AllBinarization	CodeCode Available
Qronos: Correcting the Past by Shaping the Future... in Post-Training Quantization	May 16, 2025	QuantizationText Generation	—Unverified
Formal Uncertainty Propagation for Stochastic Dynamical Systems with Additive Noise	May 16, 2025	QuantizationStochastic Optimization	—Unverified
VQ-Logits: Compressing the Output Bottleneck of Large Language Models via Vector Quantized Logits	May 15, 2025	Language ModelingLanguage Modelling	—Unverified
TransPL: VQ-Code Transition Matrices for Pseudo-Labeling of Time Series Unsupervised Domain Adaptation	May 15, 2025	Domain AdaptationPseudo Label	CodeCode Available
A probabilistic framework for dynamic quantization	May 15, 2025	Quantization	—Unverified
Efficient Mixed Precision Quantization in Graph Neural Networks	May 14, 2025	Graph ClassificationNode Classification	CodeCode Available
Zero-shot Quantization: A Comprehensive Survey	May 14, 2025	QuantizationSurvey	—Unverified
Multi-Layer Hierarchical Federated Learning with Quantization	May 13, 2025	Federated LearningQuantization	—Unverified
Resource-Efficient Language Models: Quantization for Fast and Accessible Inference	May 13, 2025	Quantization	—Unverified
Private LoRA Fine-tuning of Open-Source LLMs with Homomorphic Encryption	May 12, 2025	GPUKnowledge Base Question Answering	—Unverified
Semantic Retention and Extreme Compression in LLMs: Can We Have Both?	May 12, 2025	Language ModelingLanguage Modelling	—Unverified
Cognitive Non-Coherent Jamming Techniques for Frequency Selective Attacks	May 12, 2025	Quantization	—Unverified
Efficient ANN-SNN Conversion with Error Compensation Learning	May 12, 2025	Quantization	—Unverified
QuantX: A Framework for Hardware-Aware Quantization of Generative AI Workloads	May 12, 2025	Quantization	—Unverified
An Extra RMSNorm is All You Need for Fine Tuning to 1.58 Bits	May 12, 2025	AllKnowledge Distillation	—Unverified

Show:10 25 50

← PrevPage 21 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified