Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3176–3200 of 4925 papers

Title	Date	Tasks	Status
Understanding INT4 Quantization for Transformer Models: Latency Speedup, Composability, and Failure Cases	Jan 27, 2023	DecoderQuantization	—Unverified
Understanding the Difficulty of Low-Precision Post-Training Quantization for LLMs	Oct 18, 2024	Quantization	—Unverified
Understanding the Impact of Post-Training Quantization on Large Language Models	Sep 11, 2023	Quantization	—Unverified
Understanding the Impact of Precision Quantization on the Accuracy and Energy of Neural Networks	Dec 12, 2016	Quantization	—Unverified
Understanding Unconventional Preprocessors in Deep Convolutional Neural Networks for Face Identification	Mar 27, 2019	Data AugmentationFace Identification	—Unverified
UniCode: Learning a Unified Codebook for Multimodal Large Language Models	Mar 14, 2024	QuantizationVisual Question Answering (VQA)	—Unverified
UniCompress: Enhancing Multi-Data Medical Image Compression with Knowledge Distillation	May 27, 2024	Image CompressionKnowledge Distillation	—Unverified
Unified Analysis of Stochastic Gradient Methods for Composite Convex and Smooth Optimization	Jun 20, 2020	Quantization	—Unverified
Unified Anomaly Detection methods on Edge Device using Knowledge Distillation and Quantization	Jul 3, 2024	Anomaly DetectionCPU	—Unverified
Unified Data-Free Compression: Pruning and Quantization without Fine-Tuning	Aug 14, 2023	image-classificationImage Classification	—Unverified
Unified learning-based lossy and lossless JPEG recompression	Dec 5, 2023	Image CompressionQuantization	—Unverified
Unified Stochastic Framework for Neural Network Quantization and Pruning	Dec 24, 2024	Quantization	—Unverified
Uniform-Precision Neural Network Quantization via Neural Channel Expansion	Jan 1, 2021	Neural Architecture SearchQuantization	—Unverified
Unifying KV Cache Compression for Large Language Models with LeanKV	Dec 4, 2024	GPUQuantization	—Unverified
UnifySpeech: A Unified Framework for Zero-shot Text-to-Speech and Voice Conversion	Jan 10, 2023	Quantizationtext-to-speech	—Unverified
UniHM: Universal Human Motion Generation with Object Interactions in Indoor Scenes	May 19, 2025	Human-Object Interaction DetectionMotion Generation	—Unverified
UNIQ: Uniform Noise Injection for Non-Uniform Quantization of Neural Networks	Apr 29, 2018	Quantization	—Unverified
Universal Deep Neural Network Compression	Feb 7, 2018	Neural Network CompressionQuantization	—Unverified
Universality of Layer-Level Entropy-Weighted Quantization Beyond Model Architecture and Size	Mar 6, 2025	MMLUQuantization	—Unverified
Universal Joint Source-Channel Coding for Modulation-Agnostic Semantic Communication	May 17, 2024	DecoderQuantization	—Unverified
Universally Quantized Neural Compression	Jun 17, 2020	Quantization	—Unverified
Unleashing Dynamic Range and Resolution in Unlimited Sensing Framework via Novel Hardware	Oct 26, 2024	Quantization	—Unverified
Unlimited Sampling Radar: a Real-Time End-to-End Demonstrator	Jun 30, 2023	Quantization	—Unverified
Unlocking Efficient Large Inference Models: One-Bit Unrolling Tips the Scales	Feb 4, 2025	Language ModelingLanguage Modelling	—Unverified
Enhancing Multimodal Unified Representations for Cross Modal Generalization	Mar 8, 2024	Contrastive LearningDisentanglement	—Unverified

Show:10 25 50

← PrevPage 128 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified