Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4601–4625 of 4925 papers

Title	Date	Tasks	Status
Optimizing edge AI models on HPC systems with the edge in the loop	May 26, 2025	Hardware Aware Neural Architecture SearchKnowledge Distillation	CodeCode Available
Efficient Mixed Precision Quantization in Graph Neural Networks	May 14, 2025	Graph ClassificationNode Classification	CodeCode Available
TAS: Ternarized Neural Architecture Search for Resource-Constrained Edge Devices	Mar 14, 2022	Neural Architecture SearchQuantization	CodeCode Available
Neural Network Compression of ACAS Xu Early Prototype is Unsafe: Closed-Loop Verification through Quantized State Backreachability	Jan 17, 2022	Collision AvoidanceNeural Network Compression	CodeCode Available
Accelerated Nearest Neighbor Search with Quick ADC	Apr 24, 2017	QuantizationRetrieval	CodeCode Available
Teacher Intervention: Improving Convergence of Quantization Aware Training for Ultra-Low Precision Transformers	Feb 23, 2023	Knowledge DistillationQuantization	CodeCode Available
Communication-Efficient Federated Learning via Clipped Uniform Quantization	May 22, 2024	Federated LearningQuantization	CodeCode Available
SNN-SC: A Spiking Semantic Communication Framework for Collaborative Intelligence	Oct 13, 2022	ClassificationQuantization	CodeCode Available
Optimizing the Communication-Accuracy Trade-off in Federated Learning with Rate-Distortion Theory	Jan 7, 2022	Federated LearningQuantization	CodeCode Available
Optimizing the energy consumption of spiking neural networks for neuromorphic applications	Dec 3, 2019	Quantization	CodeCode Available
AxFormer: Accuracy-driven Approximation of Transformers for Faster, Smaller and more Accurate NLP Models	Oct 7, 2020	Hard AttentionQuantization	CodeCode Available
Learning Bag-of-Features Pooling for Deep Convolutional Neural Networks	Jul 25, 2017	General ClassificationQuantization	CodeCode Available
Orthonormal Product Quantization Network for Scalable Face Image Retrieval	Jul 1, 2021	Deep HashingFace Image Retrieval	CodeCode Available
Variance Control via Weight Rescaling in LLM Pre-training	Mar 21, 2025	Language ModelingLanguage Modelling	CodeCode Available
Learning Accurate Performance Predictors for Ultrafast Automated Model Compression	Apr 13, 2023	image-classificationImage Classification	CodeCode Available
Learning Accurate Low-Bit Deep Neural Networks with Stochastic Quantization	Aug 3, 2017	Quantization	CodeCode Available
Understanding the Effect of Model Compression on Social Bias in Large Language Models	Dec 9, 2023	Knowledge DistillationModel Compression	CodeCode Available
Learned transform compression with optimized entropy encoding	Apr 7, 2021	Quantization	CodeCode Available
Visualizing hierarchies in scRNA-seq data using a density tree-biased autoencoder	Feb 11, 2021	Dimensionality ReductionQuantization	CodeCode Available
Audio Spectral Enhancement: Leveraging Autoencoders for Low Latency Reconstruction of Long, Lossy Audio Sequences	Aug 8, 2021	Audio CompressionQuantization	CodeCode Available
Climate Finance Bench	May 28, 2025	Logical ReasoningQuantization	CodeCode Available
Language Models as Zero-shot Lossless Gradient Compressors: Towards General Neural Parameter Prior Models	Sep 26, 2024	Neural Network CompressionQuantization	CodeCode Available
CLAQ: Pushing the Limits of Low-Bit Post-Training Quantization for LLMs	May 27, 2024	Computational EfficiencyQuantization	CodeCode Available
Langevin dynamics based algorithm e-THO POULA for stochastic optimization problems with discontinuous stochastic gradient	Oct 24, 2022	Portfolio OptimizationQuantization	CodeCode Available
KVTuner: Sensitivity-Aware Layer-wise Mixed Precision KV Cache Quantization for Efficient and Nearly Lossless LLM Inference	Feb 6, 2025	Mathematical ReasoningQuantization	CodeCode Available

Show:10 25 50

← PrevPage 185 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified