Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4451–4500 of 4925 papers

Title	Date	Tasks	Status
Adaptive Loss-aware Quantization for Multi-bit Networks	Dec 18, 2019	Quantization	CodeCode Available
Self-Supervised Learning for Color Spike Camera Reconstruction	Jan 1, 2025	Motion EstimationQuantization	CodeCode Available
Quantized Fisher Discriminant Analysis	Sep 6, 2019	BIG-bench Machine LearningDimensionality Reduction	CodeCode Available
OLALa: Online Learned Adaptive Lattice Codes for Heterogeneous Federated Learning	Jun 25, 2025	Federated LearningQuantization	CodeCode Available
Quantized Fourier and Polynomial Features for more Expressive Tensor Network Models	Sep 11, 2023	Quantization	CodeCode Available
Lipschitz Continuity Retained Binary Neural Network	Jul 13, 2022	BinarizationQuantization	CodeCode Available
Linearly Converging Error Compensated SGD	Oct 23, 2020	Quantization	CodeCode Available
Self-supervised Pre-training of Text Recognizers	May 1, 2024	QuantizationTransfer Learning	CodeCode Available
Explaining Reject Options of Learning Vector Quantization Classifiers	Feb 15, 2022	counterfactualQuantization	CodeCode Available
Self-supervised Product Quantization for Deep Unsupervised Image Retrieval	Sep 6, 2021	Contrastive LearningDescriptive	CodeCode Available
Deep Triplet Quantization	Feb 1, 2019	Deep HashingImage Retrieval	CodeCode Available
Deep Task-Based Analog-to-Digital Conversion	Jan 29, 2022	Meta-LearningQuantization	CodeCode Available
Lightweight Deep Learning Based Channel Estimation for Extremely Large-Scale Massive MIMO Systems	Feb 14, 2024	Quantization	CodeCode Available
Compositional Sketch Search	Jun 15, 2021	Image RetrievalPosition	CodeCode Available
Two-Step Quantization for Low-Bit Neural Networks	Jun 1, 2018	QuantizationVocal Bursts Valence Prediction	CodeCode Available
Composite Quantization	Dec 4, 2017	Quantization	CodeCode Available
On-Device Language Models: A Comprehensive Review	Aug 26, 2024	Knowledge DistillationQuantization	CodeCode Available
Communication Efficient Private Federated Learning Using Dithering	Sep 14, 2023	Federated LearningQuantization	CodeCode Available
On-Device LLM for Context-Aware Wi-Fi Roaming	May 7, 2025	Language ModelingLanguage Modelling	CodeCode Available
Communication-Efficient Multi-Device Inference Acceleration for Transformer Models	May 25, 2025	Quantization	CodeCode Available
Lightweight Client-Side Chinese/Japanese Morphological Analyzer Based on Online Learning	Aug 1, 2014	Domain AdaptationMorphological Analysis	CodeCode Available
DeepShift: Towards Multiplication-Less Neural Networks	May 30, 2019	Edge-computingGPU	CodeCode Available
Algorithm-Hardware Co-Design of Distribution-Aware Logarithmic-Posit Encodings for Efficient DNN Inference	Mar 8, 2024	Quantization	CodeCode Available
Bag of Tricks for Optimizing Transformer Efficiency	Sep 9, 2021	CPUDecoder	CodeCode Available
Towards Efficient Verification of Quantized Neural Networks	Dec 20, 2023	Heuristic SearchQuantization	CodeCode Available
Deep reverse tone mapping	Nov 20, 2017	inverse tone mappingQuantization	CodeCode Available
Autoregressive Co-Training for Learning Discrete Speech Representations	Mar 29, 2022	Quantization	CodeCode Available
Quantized Prompt for Efficient Generalization of Vision-Language Models	Jul 15, 2024	General KnowledgeLanguage Modelling	CodeCode Available
A Binary Variational Autoencoder for Hashing	Oct 22, 2019	QuantizationRetrieval	CodeCode Available
An Information-Theoretic Analysis of Self-supervised Discrete Representations of Speech	Jun 4, 2023	QuantizationRepresentation Learning	CodeCode Available
Semi-supervised 3D Object Detection with PatchTeacher and PillarMix	Jul 13, 2024	3D Object DetectionData Augmentation	CodeCode Available
Adaptive Computation Modules: Granular Conditional Computation For Efficient Inference	Dec 15, 2023	Quantizationspeech-recognition	CodeCode Available
Light Multi-segment Activation for Model Compression	Jul 16, 2019	Knowledge Distillationmodel	CodeCode Available
QuaRL: Quantization for Fast and Environmentally Sustainable Reinforcement Learning	Oct 2, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
Communication-Efficient Federated Learning via Predictive Coding	Aug 2, 2021	Data CompressionFederated Learning	CodeCode Available
Algorithm and VLSI Design for 1-bit Data Detection in Massive MIMO-OFDM	Sep 4, 2020	Quantization	CodeCode Available
LiFT: Lightweight, FPGA-tailored 3D object detection based on LiDAR data	Jan 19, 2025	3D Object Detectionobject-detection	CodeCode Available
LFZip: Lossy compression of multivariate floating-point time series data via improved prediction	Nov 1, 2019	Data CompressionQuantization	CodeCode Available
Expansion Quantization Network: An Efficient Micro-emotion Annotation and Detection Framework	Nov 9, 2024	Emotion Detection and ClassificationQuantization	CodeCode Available
Communication-Efficient Federated Linear and Deep Generalized Canonical Correlation Analysis	Sep 25, 2021	Distributed ComputingDistributed Optimization	CodeCode Available
ExpandNet: A Deep Convolutional Neural Network for High Dynamic Range Expansion from Low Dynamic Range Content	Mar 6, 2018	inverse tone mappingInverse-Tone-Mapping	CodeCode Available
SYQ: Learning Symmetric Quantization For Efficient Deep Neural Networks	Jul 1, 2018	Quantization	CodeCode Available
One-Shot Sensitivity-Aware Mixed Sparsity Pruning for Large Language Models	Oct 14, 2023	QuantizationSensitivity	CodeCode Available
One-Step Forward and Backtrack: Overcoming Zig-Zagging in Loss-Aware Quantization Training	Jan 30, 2024	Quantization	CodeCode Available
EXAQ: Exponent Aware Quantization For LLMs Acceleration	Oct 4, 2024	QuantizationQuestion Answering	CodeCode Available
Leveraging Continuously Differentiable Activation Functions for Learning in Quantized Noisy Environments	Feb 4, 2024	Quantization	CodeCode Available
Accelerating and Compressing Deep Neural Networks for Massive MIMO CSI Feedback	Jan 20, 2023	Model CompressionNetwork Pruning	CodeCode Available
An exploration of the effect of quantisation on energy consumption and inference time of StarCoder2	Nov 15, 2024	Model CompressionQuantization	CodeCode Available
Towards Highly Accurate and Stable Face Alignment for High-Resolution Videos	Nov 1, 2018	Face AlignmentPose Estimation	CodeCode Available
Vision-Language and Large Language Model Performance in Gastroenterology: GPT, Claude, Llama, Phi, Mistral, Gemma, and Quantized Models	Aug 25, 2024	Language ModelingLanguage Modelling	CodeCode Available

Show:10 25 50

← PrevPage 90 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified