Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4576–4600 of 4925 papers

Title	Date	Tasks	Status
Efficient Text-driven Motion Generation via Latent Consistency Training	May 5, 2024	Motion GenerationQuantization	CodeCode Available
Column-wise Quantization of Weights and Partial Sums for Accurate and Efficient Compute-In-Memory Accelerators	Feb 11, 2025	Quantization	CodeCode Available
Rapid-INR: Storage Efficient CPU-free DNN Training Using Implicit Neural Representation	Jun 29, 2023	CPUGPU	CodeCode Available
Optimal Quantization for Matrix Multiplication	Oct 17, 2024	Quantization	CodeCode Available
Learning Category Trees for ID-Based Recommendation: Exploring the Power of Differentiable Vector Quantization	Aug 31, 2023	Click-Through Rate PredictionCollaborative Filtering	CodeCode Available
Learning Frequency-Specific Quantization Scaling in VVC for Standard-Compliant Task-driven Image Coding	Jan 20, 2023	Quantization	CodeCode Available
Efficient statistical classification of satellite measurements	Feb 10, 2012	ClassificationGeneral Classification	CodeCode Available
Efficient Speech Translation through Model Compression and Knowledge Distillation	May 26, 2025	Knowledge DistillationModel Compression	CodeCode Available
Optimization of Armv9 architecture general large language model inference performance based on Llama.cpp	Jun 16, 2024	Compiler OptimizationLanguage Modeling	CodeCode Available
Aggregated Learning: A Vector-Quantization Approach to Learning Neural Network Classifiers	Jan 12, 2020	ClassificationGeneral Classification	CodeCode Available
Understanding and Improving Knowledge Distillation for Quantization-Aware Training of Large Transformer Encoders	Nov 20, 2022	Knowledge DistillationModel Compression	CodeCode Available
An efficient and straightforward online quantization method for a data stream through remove-birth updating	Jun 21, 2023	Drift DetectionQuantization	CodeCode Available
An Edge Computing-Based Solution for Real-Time Leaf Disease Classification using Thermal Imaging	Nov 6, 2024	Deep LearningEdge-computing	CodeCode Available
Understanding Cache Boundness of ML Operators on ARM Processors	Feb 1, 2021	Quantization	CodeCode Available
Towards Quantized Model Parallelism for Graph-Augmented MLPs Based on Gradient-Free ADMM Framework	May 20, 2021	Quantization	CodeCode Available
When Quantization Affects Confidence of Large Language Models?	May 1, 2024	Language ModelingLanguage Modelling	CodeCode Available
Task Vector Quantization for Memory-Efficient Model Merging	Mar 10, 2025	image-classificationImage Classification	CodeCode Available
Deep Learning Models in Speech Recognition: Measuring GPU Energy Consumption, Impact of Noise and Model Quantization for Edge Deployment	May 2, 2024	GPUNVIDIA Jetson Orin Nano	CodeCode Available
Learning Convolutional Transforms for Lossy Point Cloud Geometry Compression	Mar 20, 2019	Binary ClassificationMixed Reality	CodeCode Available
Learning Compression from Limited Unlabeled Data	Sep 1, 2018	CPUGPU	CodeCode Available
Deep Learning-Based Quantization of L-Values for Gray-Coded Modulation	Jun 18, 2019	Quantization	CodeCode Available
Efficient Quantization-Aware Training on Segment Anything Model in Medical Images and Its Deployment	Dec 15, 2024	Image SegmentationMedical Image Segmentation	CodeCode Available
Optimizing Deep Neural Networks using Safety-Guided Self Compression	May 1, 2025	Language ModelingLanguage Modelling	CodeCode Available
Efficient Online Inference of Vision Transformers by Training-Free Tokenization	Nov 23, 2024	Quantization	CodeCode Available
Learning compact binary descriptors with unsupervised deep neural networks	Jun 1, 2016	Image RetrievalObject	CodeCode Available

Show:10 25 50

← PrevPage 184 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified