Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3526–3550 of 4925 papers

Title	Date	Tasks	Status
Moment Quantization for Video Temporal Grounding	Apr 3, 2025	QuantizationVideo Understanding	—Unverified
Moniqua: Modulo Quantized Communication in Decentralized SGD	Feb 26, 2020	Quantization	—Unverified
Monte Carlo Deep Neural Network Arithmetic	Sep 25, 2019	image-classificationImage Classification	—Unverified
MoQa: Rethinking MoE Quantization with Multi-stage Data-model Distribution Awareness	Mar 27, 2025	Language ModelingLanguage Modelling	—Unverified
More for Keys, Less for Values: Adaptive KV Cache Quantization	Feb 20, 2025	Quantization	—Unverified
More Tokens, Lower Precision: Towards the Optimal Token-Precision Trade-off in KV Cache Compression	Dec 17, 2024	Quantization	—Unverified
MorphIC: A 65-nm 738k-Synapse/mm^2 Quad-Core Binary-Weight Digital Neuromorphic Processor with Stochastic Spike-Driven Online Learning	Apr 17, 2019	2kQuantization	—Unverified
MoTE: Mixture of Ternary Experts for Memory-efficient Large Multimodal Models	Jun 17, 2025	Mixture-of-ExpertsQuantization	—Unverified
MotionDreamer: One-to-Many Motion Synthesis with Localized Generative Masked Transformer	Apr 11, 2025	Motion SynthesisQuantization	—Unverified
MPDCompress - Matrix Permutation Decomposition Algorithm for Deep Neural Network Compression	May 30, 2018	Neural Network CompressionQuantization	—Unverified
MPTQ-ViT: Mixed-Precision Post-Training Quantization for Vision Transformer	Jan 26, 2024	Quantization	—Unverified
MQGrad: Reinforcement Learning of Gradient Quantization in Parameter Server	Apr 22, 2018	BIG-bench Machine LearningQuantization	—Unverified
MQuant: Unleashing the Inference Potential of Multimodal Large Language Models via Full Static Quantization	Feb 1, 2025	Quantization	—Unverified
Mr.BiQ: Post-Training Non-Uniform Quantization Based on Minimizing the Reconstruction Error	Jan 1, 2022	BinarizationQuantization	—Unverified
MRQ:Support Multiple Quantization Schemes through Model Re-Quantization	Aug 1, 2023	modelQuantization	—Unverified
MSE Minimization in RIS-Aided MU-MIMO with Discrete Phase Shifts and Fronthaul Quantization	Jun 18, 2024	Quantization	—Unverified
MSP: An FPGA-Specific Mixed-Scheme, Multi-Precision Deep Neural Network Quantization Framework	Sep 16, 2020	Deep LearningEdge-computing	—Unverified
MUC-G4: Minimal Unsat Core-Guided Incremental Verification for Deep Neural Network Compression	Jun 3, 2025	Neural Network CompressionQuantization	—Unverified
MulCode: A Multiplicative Multi-way Model for Compressing Neural Language Model	Nov 1, 2019	Language ModelingLanguage Modelling	—Unverified
MuLoCo: Muon is a practical inner optimizer for DiLoCo	May 29, 2025	DecoderQuantization	—Unverified
Multi-Agent Consensus Subject to Communication and Privacy Constraints	Feb 21, 2021	Quantization	—Unverified
Multi-bit Distributed Detection of Sparse Stochastic Signals over Error-Prone Reporting Channels	Nov 6, 2024	Quantization	—Unverified
MultiCast: Zero-Shot Multivariate Time Series Forecasting Using LLMs	May 23, 2024	Multivariate Time Series ForecastingQuantization	—Unverified
Multi-Feature Discrete Collaborative Filtering for Fast Cold-start Recommendation	Mar 24, 2020	Collaborative FilteringQuantization	—Unverified
Multi-Layer Hierarchical Federated Learning with Quantization	May 13, 2025	Federated LearningQuantization	—Unverified

Show:10 25 50

← PrevPage 142 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified