Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3501–3550 of 4925 papers

Title	Date	Tasks	Status
Zeroth-Order Fine-Tuning of LLMs with Extreme Sparsity	Jun 5, 2024	GPUQuantization	—Unverified
ZipML: Training Linear Models with End-to-End Low Precision, and a Little Bit of Deep Learning	Aug 1, 2017	Quantization	—Unverified
ZipVL: Efficient Large Vision-Language Models with Dynamic Token Sparsification	Oct 11, 2024	MMEQuantization	—Unverified
ZOBNN: Zero-Overhead Dependable Design of Binary Neural Networks with Deliberately Quantized Parameters	Jul 6, 2024	AttributeQuantization	—Unverified
1.58-bit FLUX	Dec 24, 2024	Computational EfficiencyImage Generation	—Unverified
MobiVSR: A Visual Speech Recognition Solution for Mobile Devices	May 10, 2019	Lip ReadingQuantization	—Unverified
Model Agnostic Hybrid Sharding For Heterogeneous Distributed Inference	Jul 29, 2024	Quantization	—Unverified
Model-Based Detector for SSDs in the Presence of Inter-cell Interference	Jan 31, 2019	DecoderQuantization	—Unverified
Model Compression	May 20, 2021	BIG-bench Machine Learningmodel	—Unverified
Model Compression and Efficient Inference for Large Language Models: A Survey	Feb 15, 2024	Knowledge DistillationModel Compression	—Unverified
Model compression as constrained optimization, with application to neural nets. Part II: quantization	Jul 13, 2017	BinarizationModel Compression	—Unverified
Model compression as constrained optimization, with application to neural nets. Part I: general framework	Jul 5, 2017	Model CompressionObject Recognition	—Unverified
Model compression as constrained optimization, with application to neural nets. Part V: combining compressions	Jul 9, 2021	Additive modelsLow-rank compression	—Unverified
Model Compression for DNN-based Speaker Verification Using Weight Quantization	Oct 31, 2022	Model CompressionQuantization	—Unverified
Model Compression Methods for YOLOv5: A Review	Jul 21, 2023	Knowledge Distillationmodel	—Unverified
Model Hemorrhage and the Robustness Limits of Large Language Models	Mar 31, 2025	Quantization	—Unverified
Modeling Image Quantization Tradeoffs for Optimal Compression	Dec 14, 2021	Quantization	—Unverified
Modeling Realistic Degradations in Non-blind Deconvolution	Jun 4, 2018	DeblurringImage Deblurring	—Unverified
Model Predictive Control for Neuromimetic Quantized Systems	Dec 19, 2022	modelModel Predictive Control	—Unverified
Model Selection CNN-based VVC QualityEnhancement	May 7, 2021	Decodermodel	—Unverified
Modular Transformers: Compressing Transformers into Modularized Layers for Flexible Efficient Inference	Jun 4, 2023	DecoderKnowledge Distillation	—Unverified
Modulation For Modulo: A Sampling-Efficient High-Dynamic Range ADC	Nov 22, 2023	Quantization	—Unverified
Modulo Sampling: Performance Guarantees in The Presence of Quantization	Jan 2, 2025	Quantization	—Unverified
MoGenTS: Motion Generation based on Spatial-Temporal Joint Modeling	Sep 26, 2024	Motion GenerationQuantization	—Unverified
Mokey: Enabling Narrow Fixed-Point Inference for Out-of-the-Box Floating-Point Transformer Models	Mar 23, 2022	Quantization	—Unverified
Moment Quantization for Video Temporal Grounding	Apr 3, 2025	QuantizationVideo Understanding	—Unverified
Moniqua: Modulo Quantized Communication in Decentralized SGD	Feb 26, 2020	Quantization	—Unverified
Monte Carlo Deep Neural Network Arithmetic	Sep 25, 2019	image-classificationImage Classification	—Unverified
MoQa: Rethinking MoE Quantization with Multi-stage Data-model Distribution Awareness	Mar 27, 2025	Language ModelingLanguage Modelling	—Unverified
More for Keys, Less for Values: Adaptive KV Cache Quantization	Feb 20, 2025	Quantization	—Unverified
More Tokens, Lower Precision: Towards the Optimal Token-Precision Trade-off in KV Cache Compression	Dec 17, 2024	Quantization	—Unverified
MorphIC: A 65-nm 738k-Synapse/mm^2 Quad-Core Binary-Weight Digital Neuromorphic Processor with Stochastic Spike-Driven Online Learning	Apr 17, 2019	2kQuantization	—Unverified
MoTE: Mixture of Ternary Experts for Memory-efficient Large Multimodal Models	Jun 17, 2025	Mixture-of-ExpertsQuantization	—Unverified
MotionDreamer: One-to-Many Motion Synthesis with Localized Generative Masked Transformer	Apr 11, 2025	Motion SynthesisQuantization	—Unverified
MPDCompress - Matrix Permutation Decomposition Algorithm for Deep Neural Network Compression	May 30, 2018	Neural Network CompressionQuantization	—Unverified
MPTQ-ViT: Mixed-Precision Post-Training Quantization for Vision Transformer	Jan 26, 2024	Quantization	—Unverified
MQGrad: Reinforcement Learning of Gradient Quantization in Parameter Server	Apr 22, 2018	BIG-bench Machine LearningQuantization	—Unverified
MQuant: Unleashing the Inference Potential of Multimodal Large Language Models via Full Static Quantization	Feb 1, 2025	Quantization	—Unverified
Mr.BiQ: Post-Training Non-Uniform Quantization Based on Minimizing the Reconstruction Error	Jan 1, 2022	BinarizationQuantization	—Unverified
MRQ:Support Multiple Quantization Schemes through Model Re-Quantization	Aug 1, 2023	modelQuantization	—Unverified
MSE Minimization in RIS-Aided MU-MIMO with Discrete Phase Shifts and Fronthaul Quantization	Jun 18, 2024	Quantization	—Unverified
MSP: An FPGA-Specific Mixed-Scheme, Multi-Precision Deep Neural Network Quantization Framework	Sep 16, 2020	Deep LearningEdge-computing	—Unverified
MUC-G4: Minimal Unsat Core-Guided Incremental Verification for Deep Neural Network Compression	Jun 3, 2025	Neural Network CompressionQuantization	—Unverified
MulCode: A Multiplicative Multi-way Model for Compressing Neural Language Model	Nov 1, 2019	Language ModelingLanguage Modelling	—Unverified
MuLoCo: Muon is a practical inner optimizer for DiLoCo	May 29, 2025	DecoderQuantization	—Unverified
Multi-Agent Consensus Subject to Communication and Privacy Constraints	Feb 21, 2021	Quantization	—Unverified
Multi-bit Distributed Detection of Sparse Stochastic Signals over Error-Prone Reporting Channels	Nov 6, 2024	Quantization	—Unverified
MultiCast: Zero-Shot Multivariate Time Series Forecasting Using LLMs	May 23, 2024	Multivariate Time Series ForecastingQuantization	—Unverified
Multi-Feature Discrete Collaborative Filtering for Fast Cold-start Recommendation	Mar 24, 2020	Collaborative FilteringQuantization	—Unverified
Multi-Layer Hierarchical Federated Learning with Quantization	May 13, 2025	Federated LearningQuantization	—Unverified

Show:10 25 50

← PrevPage 71 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified