Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2951–3000 of 4925 papers

Title	Date	Tasks	Status
Switchable Precision Neural Networks	Feb 7, 2020	Quantization	—Unverified
Symbolic Models for Infinite Networks of Control Systems: A Compositional Approach	Feb 5, 2021	Quantization	—Unverified
Symbol-Level Precoding Design for Intelligent Reflecting Surface Assisted Multi-user MIMO Systems	Sep 3, 2019	Quantization	—Unverified
Symbol quantization in interstellar communications: methods and observations	Mar 18, 2022	Quantization	—Unverified
Symmetry Regularization and Saturating Nonlinearity for Robust Quantization	Jul 31, 2022	Quantization	—Unverified
SYMOG: learning symmetric mixture of Gaussian modes for improved fixed-point quantization	Feb 19, 2020	Quantization	—Unverified
Synchronized Video-to-Audio Generation via Mel Quantization-Continuum Decomposition	Mar 10, 2025	Audio GenerationQuantization	—Unverified
SySMOL: Co-designing Algorithms and Hardware for Neural Networks with Heterogeneous Precisions	Nov 23, 2023	CPUGPU	—Unverified
Systolic Arrays and Structured Pruning Co-design for Efficient Transformers in Edge Systems	Nov 15, 2024	Machine TranslationQuantization	—Unverified
T2S-GPT: Dynamic Vector Quantization for Autoregressive Sign Language Production from Text	Jun 11, 2024	QuantizationSign Language Production	—Unverified
T3DNet: Compressing Point Cloud Models for Lightweight 3D Recognition	Feb 29, 2024	Autonomous DrivingQuantization	—Unverified
Table-Based Neural Units: Fully Quantizing Networks for Multiply-Free Inference	Jun 11, 2019	Quantization	—Unverified
TabTreeFormer: Tabular Data Generation Using Hybrid Tree-Transformer	Jan 2, 2025	BenchmarkingQuantization	—Unverified
Tabula: Efficiently Computing Nonlinear Activation Functions for Secure Neural Network Inference	Mar 5, 2022	Quantization	—Unverified
TaDA: Training-free recipe for Decoding with Adaptive KV Cache Compression and Mean-centering	Jun 5, 2025	Quantization	—Unverified
TAFA: Design Automation of Analog Mixed-Signal FIR Filters Using Time Approximation Architecture	Dec 15, 2021	Quantization	—Unverified
TalkMosaic: Interactive PhotoMosaic with Multi-modal LLM Q&A Interactions	Sep 20, 2024	Quantization	—Unverified
Taming Sensitive Weights : Noise Perturbation Fine-tuning for Robust LLM Quantization	Dec 8, 2024	Quantization	—Unverified
TamperNN: Efficient Tampering Detection of Deployed Neural Nets	Mar 1, 2019	QuantizationSelf-Driving Cars	—Unverified
Tango: rethinking quantization for graph neural network training on GPUs	Aug 2, 2023	Graph Neural NetworkQuantization	—Unverified
TAPAS: Thermal- and Power-Aware Scheduling for LLM Inference in Cloud Platforms	Jan 5, 2025	GPUQuantization	—Unverified
TaQ-DiT: Time-aware Quantization for Diffusion Transformers	Nov 21, 2024	DenoisingModel Compression	—Unverified
Task-Aware Quantization Network for JPEG Image Compression	Aug 1, 2020	DecoderImage Compression	—Unverified
Task-Oriented Data Compression for Multi-Agent Communications Over Bit-Budgeted Channels	May 28, 2020	Autonomous DrivingData Compression	—Unverified
Task-Driven Semantic Quantization and Imitation Learning for Goal-Oriented Communications	Feb 25, 2025	Imitation LearningQuantization	—Unverified
Task Oriented Channel State Information Quantization	Apr 2, 2019	Quantization	—Unverified
Task-Oriented Communication Design at Scale	May 15, 2023	QuantizationReinforcement Learning (RL)	—Unverified
Task-Oriented Communication for Graph Data: A Graph Information Bottleneck Approach	Sep 4, 2024	Quantization	—Unverified
Task-Oriented Sensing, Computation, and Communication Integration for Multi-Device Edge AI	Jul 3, 2022	Integrated sensing and communicationISAC	—Unverified
Task-Specific Audio Coding for Machines: Machine-Learned Latent Features Are Codes for That Machine	Jul 17, 2025	Audio ClassificationAutomatic Speech Recognition	—Unverified
Task Specific Pruning with LLM-Sieve: How Many Parameters Does Your Task Really Need?	May 23, 2025	Medical Question AnsweringQuantization	—Unverified
TCAQ-DM: Timestep-Channel Adaptive Quantization for Diffusion Models	Dec 21, 2024	QuantizationVideo Generation	—Unverified
TeLLMe: An Energy-Efficient Ternary LLM Accelerator for Prefilling and Decoding on Edge FPGAs	Apr 22, 2025	Quantization	—Unverified
TeMPO: Efficient Time-Multiplexed Dynamic Photonic Tensor Core for Edge AI with Compact Slow-Light Electro-Optic Modulator	Feb 12, 2024	Quantization	—Unverified
Temporal Difference Learning with Compressed Updates: Error-Feedback meets Reinforcement Learning	Jan 3, 2023	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Temporal Dynamic Quantization for Diffusion Models	Jun 4, 2023	Quantization	—Unverified
Tender: Accelerating Large Language Models via Tensor Decomposition and Runtime Requantization	Jun 16, 2024	QuantizationTensor Decomposition	—Unverified
Tensor Learning-based Precoder Codebooks for FD-MIMO Systems	Jun 21, 2021	ClusteringQuantization	—Unverified
Tensor Recovery from Noisy and Multi-Level Quantized Measurements	Dec 5, 2019	Quantization	—Unverified
TENT: Efficient Quantization of Neural Networks on the tiny Edge with Tapered FixEd PoiNT	Apr 6, 2021	Quantization	—Unverified
TEQ: Trainable Equivalent Transformation for Quantization of LLMs	Oct 17, 2023	Quantization	—Unverified
Term Revealing: Furthering Quantization at Run Time on Quantized DNNs	Jul 13, 2020	Quantization	—Unverified
Ternary and Binary Quantization for Improved Classification	Mar 31, 2022	ClassificationDimensionality Reduction	—Unverified
Ternary Hybrid Neural-Tree Networks for Highly Constrained IoT Applications	Mar 4, 2019	Keyword SpottingQuantization	—Unverified
TernaryLLM: Ternarized Large Language Model	Jun 11, 2024	Knowledge DistillationLanguage Modeling	—Unverified
Ternary MobileNets via Per-Layer Hybrid Filter Banks	Nov 4, 2019	Quantization	—Unverified
Ternary Neural Networks with Fine-Grained Quantization	May 2, 2017	Quantization	—Unverified
Ternary Quantization: A Survey	Mar 2, 2023	QuantizationSurvey	—Unverified
Ternary Spike-based Neuromorphic Signal Processing System	Jul 7, 2024	Quantization	—Unverified
TesseraQ: Ultra Low-Bit LLM Post-Training Quantization with Block Reconstruction	Oct 24, 2024	Quantization	—Unverified

Show:10 25 50

← PrevPage 60 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified