Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 301–325 of 4925 papers

Title	Date	Tasks	Status	Hype	Score
Designing Large Foundation Models for Efficient Training and Inference: A Survey	Sep 3, 2024	Knowledge DistillationModel Compression	CodeCode Available	1	5
FQ-ViT: Post-Training Quantization for Fully Quantized Vision Transformer	Nov 27, 2021	Quantization	CodeCode Available	1	5
FrameQuant: Flexible Low-Bit Quantization for Transformers	Mar 10, 2024	Quantization	CodeCode Available	1	5
FOX-NAS: Fast, On-device and Explainable Neural Architecture Search	Aug 14, 2021	CPUNeural Architecture Search	CodeCode Available	1	5
Conditional Coding and Variable Bitrate for Practical Learned Video Coding	Apr 19, 2021	DecoderQuantization	CodeCode Available	1	5
FP4 All the Way: Fully Quantized Training of LLMs	May 25, 2025	AllQuantization	CodeCode Available	1	5
COMQ: A Backpropagation-Free Algorithm for Post-Training Quantization	Mar 11, 2024	Quantization	CodeCode Available	1	5
CondiQuant: Condition Number Based Low-Bit Quantization for Image Super-Resolution	Feb 21, 2025	Image Super-ResolutionQuantization	CodeCode Available	1	5
FLUTE: A Scalable, Extensible Framework for High-Performance Federated Learning Simulations	Mar 25, 2022	Federated LearningQuantization	CodeCode Available	1	5
Advancing Multimodal Large Language Models with Quantization-Aware Scale Learning for Efficient Adaptation	Aug 7, 2024	GPUQuantization	CodeCode Available	1	5
Accordion: Adaptive Gradient Communication via Critical Learning Regime Identification	Oct 29, 2020	Quantization	CodeCode Available	1	5
Structured Multi-Track Accompaniment Arrangement via Style Prior Modelling	Oct 25, 2023	Computational EfficiencyDisentanglement	CodeCode Available	1	5
ADMM-NN: An Algorithm-Hardware Co-Design Framework of DNNs Using Alternating Direction Method of Multipliers	Dec 31, 2018	Model CompressionQuantization	CodeCode Available	1	5
Compression with Bayesian Implicit Neural Representations	May 30, 2023	Audio CompressionQuantization	CodeCode Available	1	5
FretNet: Continuous-Valued Pitch Contour Streaming for Polyphonic Guitar Tablature Transcription	Dec 6, 2022	Music TranscriptionQuantization	CodeCode Available	1	5
Generative Adversarial Super-Resolution at the Edge with Knowledge Distillation	Sep 7, 2022	CPUGenerative Adversarial Network	CodeCode Available	1	5
Fine-Grained Causal Dynamics Learning with Quantization for Improving Robustness in Reinforcement Learning	Jun 5, 2024	QuantizationReinforcement Learning (RL)	CodeCode Available	1	5
Fine-grained Data Distribution Alignment for Post-Training Quantization	Sep 9, 2021	Quantization	CodeCode Available	1	5
Compress Any Segment Anything Model (SAM)	Jul 11, 2025	modelQuantization	CodeCode Available	1	5
Compressing LLMs: The Truth is Rarely Pure and Never Simple	Oct 2, 2023	QuantizationRetrieval	CodeCode Available	1	5
Finding the Task-Optimal Low-Bit Sub-Distribution in Deep Neural Networks	Dec 30, 2021	CPUimage-classification	CodeCode Available	1	5
Fine-tuning Quantized Neural Networks with Zeroth-order Optimization	May 19, 2025	GPUQuantization	CodeCode Available	1	5
Few shot font generation via transferring similarity guided global style and quantization local style	Sep 2, 2023	DisentanglementFont Generation	CodeCode Available	1	5
Comprehensive Graph-conditional Similarity Preserving Network for Unsupervised Cross-modal Hashing	Dec 25, 2020	QuantizationRetrieval	CodeCode Available	1	5
FFNeRV: Flow-Guided Frame-Wise Neural Representations for Videos	Dec 23, 2022	Model CompressionQuantization	CodeCode Available	1	5

Show:10 25 50

← PrevPage 13 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified