Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2351–2400 of 4925 papers

Title	Date	Tasks	Status
A Novel Light Field Coding Scheme Based on Deep Belief Network & Weighted Binary Images for Additive Layered Displays	Oct 4, 2022	Mixed RealityQuantization	—Unverified
Efficient multivariate sequence classification	Sep 29, 2014	ClassificationGeneral Classification	—Unverified
CALM: Co-evolution of Algorithms and Language Model for Automatic Heuristic Design	May 18, 2025	GPULanguage Modeling	—Unverified
Efficient Match Kernel between Sets of Features for Visual Recognition	Dec 1, 2009	Quantization	—Unverified
Efficient Machine Translation with Model Pruning and Quantization	Nov 1, 2021	CPUDecoder	—Unverified
A Novel Hybrid Precoder With Low-Resolution Phase Shifters and Fronthaul Capacity Limitation	Jan 18, 2025	Quantization	—Unverified
Adaptive Integrate-and-Fire Time Encoding Machine with Quantization	Mar 5, 2024	Quantization	—Unverified
Efficiently Scaling Transformer Inference	Nov 9, 2022	Quantization	—Unverified
EfficientLLM: Efficiency in Large Language Models	May 20, 2025	Mixture-of-ExpertsQuantization	—Unverified
Efficient Learned Lossless JPEG Recompression	Aug 25, 2023	GPUImage Compression	—Unverified
Cactus Mechanisms: Optimal Differential Privacy Mechanisms in the Large-Composition Regime	Jun 25, 2022	Quantization	—Unverified
A Novel Framework for Image-to-image Translation and Image Compression	Nov 25, 2021	Image CompressionImage Generation	—Unverified
Efficient Large-Scale Approximate Nearest Neighbor Search on OpenCL FPGA	Jun 1, 2018	CPUGPU	—Unverified
Efficient Inferencing of Compressed Deep Neural Networks	Nov 1, 2017	Quantization	—Unverified
CacheQuant: Comprehensively Accelerated Diffusion Models	Jan 1, 2025	Image GenerationQuantization	—Unverified
A Novel Chaotic Uniform Quantizer for Speech Coding	Oct 11, 2018	Data CompressionQuantization	—Unverified
Accelerated Distance Computation with Encoding Tree for High Dimensional Data	Sep 17, 2015	QuantizationVocal Bursts Intensity Prediction	—Unverified
Discrete Audio Tokens: More Than a Survey!	Jun 12, 2025	Language ModelingLanguage Modelling	—Unverified
STBLLM: Breaking the 1-Bit Barrier with Structured Binary LLMs	Aug 3, 2024	BinarizationComputational Efficiency	—Unverified
Efficient Inference via Universal LSH Kernel	Jun 21, 2021	Knowledge DistillationQuantization	—Unverified
Efficient Implicit Neural Compression of Point Clouds via Learnable Activation in Latent Space	Apr 20, 2025	AttributeDecoder	—Unverified
Efficient Hybrid Network Architectures for Extremely Quantized Neural Networks Enabling Intelligence at the Edge	Feb 1, 2019	Edge-computingQuantization	—Unverified
A Novel Audio Representation for Music Genre Identification in MIR	Apr 1, 2024	Information RetrievalMusic Information Retrieval	—Unverified
Efficient Hardware Implementation of Incremental Learning and Inference on Chip	Nov 18, 2019	CPUIncremental Learning	—Unverified
Efficient Generative Modeling with Residual Vector Quantization-Based Tokens	Dec 13, 2024	Conditional Image GenerationImage Generation	—Unverified
CA3D: Convolutional-Attentional 3D Nets for Efficient Video Activity Recognition on the Edge	May 26, 2025	Activity RecognitionQuantization	—Unverified
Efficient FPGA-accelerated Convolutional Neural Networks for Cloud Detection on CubeSats	Apr 4, 2025	Cloud DetectionQuantization	—Unverified
Efficient Fine-Tuning of Quantized Models via Adaptive Rank and Bitwidth	May 2, 2025	GSM8KQuantization	—Unverified
Byzantine-Resilient Secure Federated Learning	Jul 21, 2020	Federated LearningOutlier Detection	—Unverified
A Novel Approach to Quantized Matrix Completion Using Huber Loss Measure	Oct 29, 2018	Matrix CompletionQuantization	—Unverified
Adaptive Dither Voting for Robust Spatial Verification	Dec 1, 2015	QuantizationRetrieval	—Unverified
Efficient Federated Learning over Multiple Access Channel with Differential Privacy Constraints	May 15, 2020	Federated LearningQuantization	—Unverified
Bullion: A Column Store for Machine Learning	Apr 13, 2024	QuantizationRecommendation Systems	—Unverified
Efficient Execution of Quantized Deep Learning Models: A Compiler Approach	Jun 18, 2020	CPUDeep Learning	—Unverified
Efficient Evaluation of Quantization-Effects in Neural Codecs	Feb 7, 2025	DecoderQuantization	—Unverified
Building an Efficiency Pipeline: Commutativity and Cumulativeness of Efficiency Operators for Transformers	Jul 31, 2022	Quantization	—Unverified
A notion of stability for k-means clustering	Jan 29, 2018	ClusteringQuantization	—Unverified
Efficient Error-Tolerant Quantized Neural Network Accelerators	Dec 16, 2019	QuantizationScheduling	—Unverified
BTEL: A Binary Tree Encoding Approach for Visual Localization	Jun 27, 2019	Image RetrievalQuantization	—Unverified
Egeria: Efficient DNN Training with Knowledge-Guided Layer Freezing	Jan 17, 2022	Quantization	—Unverified
Another Way to the Top: Exploit Contextual Clustering in Learned Image Coding	Jan 21, 2024	ClusteringImage Compression	—Unverified
Adaptive Dithering Using Curved Markov-Gaussian Noise in the Quantized Domain for Mapping SDR to HDR Image	Jan 20, 2020	inverse tone mappingInverse-Tone-Mapping	—Unverified
Accelerated AI Inference via Dynamic Execution Methods	Oct 30, 2024	Quantization	—Unverified
Efficient Distributed Training through Gradient Compression with Sparsification and Quantization Techniques	Dec 7, 2024	Quantization	—Unverified
Peering Beyond the Gradient Veil with Distributed Auto Differentiation	Feb 18, 2021	Quantization	—Unverified
Efficient Discrete Supervised Hashing for Large-scale Cross-modal Retrieval	May 3, 2019	Cross-Modal RetrievalQuantization	—Unverified
BRICS: Bi-level feature Representation of Image CollectionS	May 29, 2023	DecoderImage Generation	—Unverified
An Optimization Framework for Federated Edge Learning	Nov 26, 2021	Edge-computingFederated Learning	—Unverified
Efficient Decoupled Feature 3D Gaussian Splatting via Hierarchical Compression	Jan 1, 2025	3DGSQuantization	—Unverified
Efficient Convolutional Neural Network with Binary Quantization Layer	Nov 21, 2016	ClusteringImage Segmentation	—Unverified

Show:10 25 50

← PrevPage 48 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified