Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1226–1250 of 4925 papers

Title	Date	Tasks	Status
Fast Jet Tagging with MLP-Mixers on FPGAs	Mar 5, 2025	Jet TaggingQuantization	—Unverified
Q&C: When Quantization Meets Cache in Efficient Image Generation	Mar 4, 2025	Image GenerationQuantization	CodeCode Available
Sparse Meets Dense: Unified Generative Recommendations with Cascaded Sparse-Dense Representations	Mar 4, 2025	QuantizationRecommendation Systems	—Unverified
BdSLW401: Transformer-Based Word-Level Bangla Sign Language Recognition Using Relative Quantization Encoding (RQE)	Mar 4, 2025	QuantizationSign Language Recognition	—Unverified
Regularization-based Framework for Quantization-, Fault- and Variability-Aware Training	Mar 3, 2025	Quantization	—Unverified
KurTail : Kurtosis-based LLM Quantization	Mar 3, 2025	GPULanguage Modeling	—Unverified
Cauchy-Schwarz Regularizers	Mar 3, 2025	Quantization	CodeCode Available
Towards Improved Text-Aligned Codebook Learning: Multi-Hierarchical Codebook-Text Alignment with Long Text	Mar 3, 2025	Image GenerationQuantization	—Unverified
DILEMMA: Joint LLM Quantization and Distributed LLM Inference Over Edge Computing Systems	Mar 3, 2025	Edge-computingKnowledge Distillation	—Unverified
DeRS: Towards Extremely Efficient Upcycled Mixture-of-Experts Models	Mar 3, 2025	Mixture-of-ExpertsQuantization	—Unverified
Patient-Level Anatomy Meets Scanning-Level Physics: Personalized Federated Low-Dose CT Denoising Empowered by Large Language Model	Mar 2, 2025	AnatomyDenoising	CodeCode Available
MedUnifier: Unifying Vision-and-Language Pre-training on Medical Data with Vision Generation Task using Discrete Visual Representations	Mar 2, 2025	image-classificationImage Classification	—Unverified
Strong Solutions and Quantization-Based Numerical Schemes for a Class of Non-Markovian Volatility Models	Feb 28, 2025	Quantization	—Unverified
Transformer-Based Nonlinear Transform Coding for Multi-Rate CSI Compression in MIMO-OFDM Systems	Feb 27, 2025	Image CompressionQuantization	—Unverified
HALO: Hardware-aware quantization with low critical-path-delay weights for LLM acceleration	Feb 27, 2025	Quantization	—Unverified
Beyond the Tip of Efficiency: Uncovering the Submerged Threats of Jailbreak Attacks in Small Language Models	Feb 27, 2025	Knowledge DistillationModel Compression	—Unverified
Speculative Decoding and Beyond: An In-Depth Review of Techniques	Feb 27, 2025	Quantization	—Unverified
On the Privacy-Preserving Properties of Spiking Neural Networks with Unique Surrogate Gradients and Quantization Levels	Feb 25, 2025	Privacy PreservingQuantization	—Unverified
Compressing Language Models for Specialized Domains	Feb 25, 2025	Quantization	—Unverified
Memory-Free and Parallel Computation for Quantized Spiking Neural Networks	Feb 25, 2025	Computational EfficiencyQuantization	—Unverified
Task-Driven Semantic Quantization and Imitation Learning for Goal-Oriented Communications	Feb 25, 2025	Imitation LearningQuantization	—Unverified
Unbiased and Sign Compression in Distributed Learning: Comparing Noise Resilience via SDEs	Feb 24, 2025	Distributed OptimizationLanguage Modeling	—Unverified
Compression Scaling Laws:Unifying Sparsity and Quantization	Feb 23, 2025	Quantization	—Unverified
Energy-Efficient Transformer Inference: Optimization Strategies for Time Series Classification	Feb 23, 2025	ClassificationInference Optimization	—Unverified
Dr. Splat: Directly Referring 3D Gaussian Splatting via Direct Language Embedding Registration	Feb 23, 2025	3DGS3D Semantic Segmentation	—Unverified

Show:10 25 50

← PrevPage 50 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified