Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4551–4600 of 4925 papers

Title	Date	Tasks	Status
Deep Metric Learning to Rank	Jun 1, 2019	Image RetrievalLearning-To-Rank	CodeCode Available
Learning to Seek: Autonomous Source Seeking with Deep Reinforcement Learning Onboard a Nano Drone Microcontroller	Sep 25, 2019	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available
Layer-Wise Quantization: A Pragmatic and Effective Method for Quantizing LLMs Beyond Integer Bit-Levels	Jun 25, 2024	Language ModellingLarge Language Model	CodeCode Available
AdaBin: Improving Binary Neural Networks with Adaptive Binary Sets	Aug 17, 2022	Classification with Binary Neural NetworkQuantization	CodeCode Available
Empirical Evaluation of Deep Learning Model Compression Techniques on the WaveNet Vocoder	Nov 20, 2020	Model CompressionQuantization	CodeCode Available
PLUM: Improving Inference Efficiency By Leveraging Repetition-Sparsity Trade-Off	Dec 4, 2023	BinarizationComputational Efficiency	CodeCode Available
SignSGD with Federated Defense: Harnessing Adversarial Attacks through Gradient Sign Decoding	Feb 2, 2024	Adversarial AttackQuantization	CodeCode Available
Open-source FPGA-ML codesign for the MLPerf Tiny Benchmark	Jun 23, 2022	Anomaly Detectionimage-classification	CodeCode Available
Learning Space Partitions for Nearest Neighbor Search	Jan 24, 2019	General Classificationgraph partitioning	CodeCode Available
Random and Adversarial Bit Error Robustness: Energy-Efficient and Secure DNN Accelerators	Apr 16, 2021	Quantization	CodeCode Available
Operations Guided Neural Networks for High Fidelity Data-To-Text Generation	Sep 8, 2018	Data-to-Text GenerationDecoder	CodeCode Available
SignSGD with Federated Voting	Mar 25, 2024	Quantization	CodeCode Available
Random Entity Quantization for Parameter-Efficient Compositional Knowledge Graph Representation	Oct 24, 2023	Knowledge GraphsQuantization	CodeCode Available
EmbBERT-Q: Breaking Memory Barriers in Embedded NLP	Feb 14, 2025	MambaQuantization	CodeCode Available
Randomized Quantization is All You Need for Differential Privacy in Federated Learning	Jun 20, 2023	AllFederated Learning	CodeCode Available
Automatic Neural Network Compression by Sparsity-Quantization Joint Learning: A Constrained Optimization-based Approach	Oct 14, 2019	Neural Network CompressionQuantization	CodeCode Available
Elastic Product Quantization for Time Series	Jan 4, 2022	QuantizationTime Series	CodeCode Available
Learning Semantic Textual Similarity via Topic-informed Discrete Latent Variables	Nov 7, 2022	Language ModelingLanguage Modelling	CodeCode Available
Optimal Clipping and Magnitude-aware Differentiation for Improved Quantization-aware Training	Jun 13, 2022	Quantization	CodeCode Available
Task-Based Graph Signal Compression	Oct 24, 2021	Quantization	CodeCode Available
Unconditional Image-Text Pair Generation with Multimodal Cross Quantizer	Apr 15, 2022	multimodal generationQuantization	CodeCode Available
Deep Log-Likelihood Ratio Quantization	Mar 11, 2019	DecoderQuantization	CodeCode Available
Learning Physical-Layer Communication with Quantized Feedback	Apr 19, 2019	Quantization	CodeCode Available
Deep Learning with Low Precision by Half-wave Gaussian Quantization	Feb 3, 2017	Deep LearningQuantization	CodeCode Available
Efficiera Residual Networks: Hardware-Friendly Fully Binary Weight with 2-bit Activation Model Achieves Practical ImageNet Accuracy	Oct 15, 2024	BinarizationClassification with Binary Weight Network	CodeCode Available
Efficient Text-driven Motion Generation via Latent Consistency Training	May 5, 2024	Motion GenerationQuantization	CodeCode Available
Column-wise Quantization of Weights and Partial Sums for Accurate and Efficient Compute-In-Memory Accelerators	Feb 11, 2025	Quantization	CodeCode Available
Rapid-INR: Storage Efficient CPU-free DNN Training Using Implicit Neural Representation	Jun 29, 2023	CPUGPU	CodeCode Available
Optimal Quantization for Matrix Multiplication	Oct 17, 2024	Quantization	CodeCode Available
Learning Category Trees for ID-Based Recommendation: Exploring the Power of Differentiable Vector Quantization	Aug 31, 2023	Click-Through Rate PredictionCollaborative Filtering	CodeCode Available
Learning Frequency-Specific Quantization Scaling in VVC for Standard-Compliant Task-driven Image Coding	Jan 20, 2023	Quantization	CodeCode Available
Efficient statistical classification of satellite measurements	Feb 10, 2012	ClassificationGeneral Classification	CodeCode Available
Efficient Speech Translation through Model Compression and Knowledge Distillation	May 26, 2025	Knowledge DistillationModel Compression	CodeCode Available
Optimization of Armv9 architecture general large language model inference performance based on Llama.cpp	Jun 16, 2024	Compiler OptimizationLanguage Modeling	CodeCode Available
Aggregated Learning: A Vector-Quantization Approach to Learning Neural Network Classifiers	Jan 12, 2020	ClassificationGeneral Classification	CodeCode Available
Understanding and Improving Knowledge Distillation for Quantization-Aware Training of Large Transformer Encoders	Nov 20, 2022	Knowledge DistillationModel Compression	CodeCode Available
An efficient and straightforward online quantization method for a data stream through remove-birth updating	Jun 21, 2023	Drift DetectionQuantization	CodeCode Available
An Edge Computing-Based Solution for Real-Time Leaf Disease Classification using Thermal Imaging	Nov 6, 2024	Deep LearningEdge-computing	CodeCode Available
Understanding Cache Boundness of ML Operators on ARM Processors	Feb 1, 2021	Quantization	CodeCode Available
Towards Quantized Model Parallelism for Graph-Augmented MLPs Based on Gradient-Free ADMM Framework	May 20, 2021	Quantization	CodeCode Available
When Quantization Affects Confidence of Large Language Models?	May 1, 2024	Language ModelingLanguage Modelling	CodeCode Available
Task Vector Quantization for Memory-Efficient Model Merging	Mar 10, 2025	image-classificationImage Classification	CodeCode Available
Deep Learning Models in Speech Recognition: Measuring GPU Energy Consumption, Impact of Noise and Model Quantization for Edge Deployment	May 2, 2024	GPUNVIDIA Jetson Orin Nano	CodeCode Available
Learning Convolutional Transforms for Lossy Point Cloud Geometry Compression	Mar 20, 2019	Binary ClassificationMixed Reality	CodeCode Available
Learning Compression from Limited Unlabeled Data	Sep 1, 2018	CPUGPU	CodeCode Available
Deep Learning-Based Quantization of L-Values for Gray-Coded Modulation	Jun 18, 2019	Quantization	CodeCode Available
Efficient Quantization-Aware Training on Segment Anything Model in Medical Images and Its Deployment	Dec 15, 2024	Image SegmentationMedical Image Segmentation	CodeCode Available
Optimizing Deep Neural Networks using Safety-Guided Self Compression	May 1, 2025	Language ModelingLanguage Modelling	CodeCode Available
Efficient Online Inference of Vision Transformers by Training-Free Tokenization	Nov 23, 2024	Quantization	CodeCode Available
Learning compact binary descriptors with unsupervised deep neural networks	Jun 1, 2016	Image RetrievalObject	CodeCode Available

Show:10 25 50

← PrevPage 92 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified