Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2976–3000 of 4925 papers

Title	Date	Tasks	Status
Task Oriented Channel State Information Quantization	Apr 2, 2019	Quantization	—Unverified
Task-Oriented Communication Design at Scale	May 15, 2023	QuantizationReinforcement Learning (RL)	—Unverified
Task-Oriented Communication for Graph Data: A Graph Information Bottleneck Approach	Sep 4, 2024	Quantization	—Unverified
Task-Oriented Sensing, Computation, and Communication Integration for Multi-Device Edge AI	Jul 3, 2022	Integrated sensing and communicationISAC	—Unverified
Task-Specific Audio Coding for Machines: Machine-Learned Latent Features Are Codes for That Machine	Jul 17, 2025	Audio ClassificationAutomatic Speech Recognition	—Unverified
Task Specific Pruning with LLM-Sieve: How Many Parameters Does Your Task Really Need?	May 23, 2025	Medical Question AnsweringQuantization	—Unverified
TCAQ-DM: Timestep-Channel Adaptive Quantization for Diffusion Models	Dec 21, 2024	QuantizationVideo Generation	—Unverified
TeLLMe: An Energy-Efficient Ternary LLM Accelerator for Prefilling and Decoding on Edge FPGAs	Apr 22, 2025	Quantization	—Unverified
TeMPO: Efficient Time-Multiplexed Dynamic Photonic Tensor Core for Edge AI with Compact Slow-Light Electro-Optic Modulator	Feb 12, 2024	Quantization	—Unverified
Temporal Difference Learning with Compressed Updates: Error-Feedback meets Reinforcement Learning	Jan 3, 2023	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Temporal Dynamic Quantization for Diffusion Models	Jun 4, 2023	Quantization	—Unverified
Tender: Accelerating Large Language Models via Tensor Decomposition and Runtime Requantization	Jun 16, 2024	QuantizationTensor Decomposition	—Unverified
Tensor Learning-based Precoder Codebooks for FD-MIMO Systems	Jun 21, 2021	ClusteringQuantization	—Unverified
Tensor Recovery from Noisy and Multi-Level Quantized Measurements	Dec 5, 2019	Quantization	—Unverified
TENT: Efficient Quantization of Neural Networks on the tiny Edge with Tapered FixEd PoiNT	Apr 6, 2021	Quantization	—Unverified
TEQ: Trainable Equivalent Transformation for Quantization of LLMs	Oct 17, 2023	Quantization	—Unverified
Term Revealing: Furthering Quantization at Run Time on Quantized DNNs	Jul 13, 2020	Quantization	—Unverified
Ternary and Binary Quantization for Improved Classification	Mar 31, 2022	ClassificationDimensionality Reduction	—Unverified
Ternary Hybrid Neural-Tree Networks for Highly Constrained IoT Applications	Mar 4, 2019	Keyword SpottingQuantization	—Unverified
TernaryLLM: Ternarized Large Language Model	Jun 11, 2024	Knowledge DistillationLanguage Modeling	—Unverified
Ternary MobileNets via Per-Layer Hybrid Filter Banks	Nov 4, 2019	Quantization	—Unverified
Ternary Neural Networks with Fine-Grained Quantization	May 2, 2017	Quantization	—Unverified
Ternary Quantization: A Survey	Mar 2, 2023	QuantizationSurvey	—Unverified
Ternary Spike-based Neuromorphic Signal Processing System	Jul 7, 2024	Quantization	—Unverified
TesseraQ: Ultra Low-Bit LLM Post-Training Quantization with Block Reconstruction	Oct 24, 2024	Quantization	—Unverified

Show:10 25 50

← PrevPage 120 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified