Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3001–3050 of 4925 papers

Title	Date	Tasks	Status
Tetra-AML: Automatic Machine Learning via Tensor Networks	Mar 28, 2023	Bayesian OptimizationHyperparameter Optimization	—Unverified
Di^2Pose: Discrete Diffusion Model for Occluded 3D Human Pose Estimation	May 27, 2024	3D Human Pose EstimationMonocular 3D Human Pose Estimation	—Unverified
Text me the data: Generating Ground Pressure Sequence from Textual Descriptions for HAR	Feb 22, 2024	Activity RecognitionHuman Activity Recognition	—Unverified
DoStoVoQ: Doubly Stochastic Voronoi Vector Quantization SGD for Federated Learning	May 21, 2021	Federated LearningQuantization	—Unverified
Texture CNN for Thermoelectric Metal Pipe Image Classification	May 28, 2019	ClassificationGeneral Classification	—Unverified
The Bach Doodle: Approachable music composition with machine learning at scale	Jul 14, 2019	BIG-bench Machine LearningQuantization	—Unverified
The Binary and Ternary Quantization Can Improve Feature Discrimination	Apr 18, 2025	ClassificationQuantization	—Unverified
The Binary Quantized Neural Network for Dense Prediction via Specially Designed Upsampling and Attention	May 28, 2024	object-detectionObject Detection	—Unverified
The bottleneck and ceiling effects in quantized tracking control of heterogeneous multi-agent systems under DoS attacks	Nov 1, 2023	Quantization	—Unverified
The Bussgang Decomposition of Non-Linear Systems: Basic Theory and MIMO Extensions	May 4, 2020	MisconceptionsQuantization	—Unverified
The Canonical Distortion Measure for Vector Quantization and Function Approximation	Nov 14, 2019	Quantization	—Unverified
The Convergence of Sparsified Gradient Methods	Sep 27, 2018	Quantization	—Unverified
The Cramer-Rao Bound for Signal Parameter Estimation from Quantized Data	Sep 27, 2022	parameter estimationQuantization	—Unverified
The Devil is in the Details: Simple Remedies for Image-to-LiDAR Representation Learning	Jan 16, 2025	3D Object Detection3D Semantic Segmentation	—Unverified
The effect of fatigue on the performance of online writer recognition	Feb 24, 2022	Dynamic Time WarpingQuantization	—Unverified
The Effect of Quantization in Federated Learning: A Rényi Differential Privacy Perspective	May 16, 2024	Federated LearningPrivacy Preserving	—Unverified
The Hidden Cost of an Image: Quantifying the Energy Consumption of AI Image Generation	Jun 20, 2025	Image GenerationQuantization	—Unverified
The Impact of Quantization and Pruning on Deep Reinforcement Learning Models	Jul 5, 2024	Deep Reinforcement LearningModel Compression	—Unverified
The Impact of Quantization on Retrieval-Augmented Generation: An Analysis of Small LLMs	Jun 10, 2024	QuantizationRAG	—Unverified
The Impact of Quantization on the Robustness of Transformer-based Text Classifiers	Mar 8, 2024	QuantizationSST-2	—Unverified
The Interpretability of Codebooks in Model-Based Reinforcement Learning is Limited	Jul 28, 2024	Deep Reinforcement LearningDisentanglement	—Unverified
The Nature of Mathematical Modeling and Probabilistic Optimization Engineering in Generative AI	Oct 24, 2024	Quantization	—Unverified
The NLP Cookbook: Modern Recipes for Transformer based Deep Learning Architectures	Mar 23, 2021	Information RetrievalKnowledge Distillation	—Unverified
The quantization error in a Self-Organizing Map as a contrast and colour specific indicator of single-pixel change in large random patterns	Nov 8, 2020	QuantizationTime Series	—Unverified
The Rate-Distortion-Accuracy Tradeoff: JPEG Case Study	Aug 3, 2020	DecoderQuantization	—Unverified
The Sockeye 2 Neural Machine Translation Toolkit at AMTA 2020	Aug 11, 2020	CPUMachine Translation	—Unverified
The Synthesis of XNOR Recurrent Neural Networks with Stochastic Logic	Dec 1, 2019	Quantization	—Unverified
The Uniqueness of LLaMA3-70B Series with Per-Channel Quantization	Aug 27, 2024	Quantization	—Unverified
The Wavefunction of Continuous-Time Recurrent Neural Networks	Feb 13, 2021	Quantization	—Unverified
ThinK: Thinner Key Cache by Query-Driven Pruning	Jul 30, 2024	GPUQuantization	—Unverified
Three Quantization Regimes for ReLU Networks	May 3, 2024	Quantization	—Unverified
Through a Compressed Lens: Investigating the Impact of Quantization on LLM Explainability and Interpretability	May 20, 2025	counterfactualMemorization	—Unverified
Tiled Bit Networks: Sub-Bit Neural Network Compression Through Reuse of Learnable Binary Vectors	Jul 16, 2024	GPUNeural Network Compression	—Unverified
Time-Correlated Sparsification for Communication-Efficient Federated Learning	Jan 21, 2021	Federated LearningQuantization	—Unverified
Time regularization as a solution to mitigate quantization induced performance degradation	Oct 30, 2020	Quantization	—Unverified
Timestep-Aware Correction for Quantized Diffusion Models	Jul 4, 2024	AttributeNoise Estimation	—Unverified
Tiny but Accurate: A Pruned, Quantized and Optimized Memristor Crossbar Framework for Ultra Efficient DNN Implementation	Aug 27, 2019	Model CompressionQuantization	—Unverified
TinyissimoYOLO: A Quantized, Low-Memory Footprint, TinyML Object Detection Network for Low Power Microcontrollers	May 22, 2023	Objectobject-detection	—Unverified
TinyKG: Memory-Efficient Training Framework for Knowledge Graph Neural Recommender Systems	Dec 8, 2022	GPUKnowledge Graphs	—Unverified
TinyM^2Net: A Flexible System Algorithm Co-designed Multimodal Learning Framework for Tiny Devices	Feb 9, 2022	Classificationobject-detection	—Unverified
TinyM^2Net-V3: Memory-Aware Compressed Multimodal Deep Neural Networks for Sustainable Edge Deployment	May 20, 2024	Knowledge DistillationModel Compression	—Unverified
tinySNN: Towards Memory- and Energy-Efficient Spiking Neural Networks	Jun 17, 2022	Quantization	—Unverified
Tiny-VBF: Resource-Efficient Vision Transformer based Lightweight Beamformer for Ultrasound Single-Angle Plane Wave Imaging	Nov 20, 2023	Deep LearningQuantization	—Unverified
TinyVQA: Compact Multimodal Deep Neural Network for Visual Question Answering on Resource-Constrained Devices	Apr 4, 2024	QuantizationQuestion Answering	—Unverified
Tk-merge: Computationally Efficient Robust Clustering Under General Assumptions	Jan 17, 2022	ClusteringQuantization	—Unverified
TMPQ-DM: Joint Timestep Reduction and Quantization Precision Selection for Efficient Diffusion Models	Apr 15, 2024	DenoisingModel Optimization	—Unverified
To Compress, or Not to Compress: Characterizing Deep Learning Model Compression for Embedded Inference	Oct 21, 2018	Deep Learningimage-classification	—Unverified
ToneUnit: A Speech Discretization Approach for Tonal Language Speech Synthesis	Jun 13, 2024	QuantizationSpeech Synthesis	—Unverified
Topological Analysis for Detecting Anomalies (TADA) in Time Series	Jun 10, 2024	QuantizationTime Series	—Unverified
Topologically Controlled Lossy Compression	Feb 8, 2018	QuantizationTopological Data Analysis	—Unverified

Show:10 25 50

← PrevPage 61 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified