Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4601–4650 of 4925 papers

Title	Date	Tasks	Status
Optimizing edge AI models on HPC systems with the edge in the loop	May 26, 2025	Hardware Aware Neural Architecture SearchKnowledge Distillation	CodeCode Available
Efficient Mixed Precision Quantization in Graph Neural Networks	May 14, 2025	Graph ClassificationNode Classification	CodeCode Available
TAS: Ternarized Neural Architecture Search for Resource-Constrained Edge Devices	Mar 14, 2022	Neural Architecture SearchQuantization	CodeCode Available
Neural Network Compression of ACAS Xu Early Prototype is Unsafe: Closed-Loop Verification through Quantized State Backreachability	Jan 17, 2022	Collision AvoidanceNeural Network Compression	CodeCode Available
Accelerated Nearest Neighbor Search with Quick ADC	Apr 24, 2017	QuantizationRetrieval	CodeCode Available
Teacher Intervention: Improving Convergence of Quantization Aware Training for Ultra-Low Precision Transformers	Feb 23, 2023	Knowledge DistillationQuantization	CodeCode Available
Communication-Efficient Federated Learning via Clipped Uniform Quantization	May 22, 2024	Federated LearningQuantization	CodeCode Available
SNN-SC: A Spiking Semantic Communication Framework for Collaborative Intelligence	Oct 13, 2022	ClassificationQuantization	CodeCode Available
Optimizing the Communication-Accuracy Trade-off in Federated Learning with Rate-Distortion Theory	Jan 7, 2022	Federated LearningQuantization	CodeCode Available
Optimizing the energy consumption of spiking neural networks for neuromorphic applications	Dec 3, 2019	Quantization	CodeCode Available
AxFormer: Accuracy-driven Approximation of Transformers for Faster, Smaller and more Accurate NLP Models	Oct 7, 2020	Hard AttentionQuantization	CodeCode Available
Learning Bag-of-Features Pooling for Deep Convolutional Neural Networks	Jul 25, 2017	General ClassificationQuantization	CodeCode Available
Orthonormal Product Quantization Network for Scalable Face Image Retrieval	Jul 1, 2021	Deep HashingFace Image Retrieval	CodeCode Available
Variance Control via Weight Rescaling in LLM Pre-training	Mar 21, 2025	Language ModelingLanguage Modelling	CodeCode Available
Learning Accurate Performance Predictors for Ultrafast Automated Model Compression	Apr 13, 2023	image-classificationImage Classification	CodeCode Available
Learning Accurate Low-Bit Deep Neural Networks with Stochastic Quantization	Aug 3, 2017	Quantization	CodeCode Available
Understanding the Effect of Model Compression on Social Bias in Large Language Models	Dec 9, 2023	Knowledge DistillationModel Compression	CodeCode Available
Learned transform compression with optimized entropy encoding	Apr 7, 2021	Quantization	CodeCode Available
Visualizing hierarchies in scRNA-seq data using a density tree-biased autoencoder	Feb 11, 2021	Dimensionality ReductionQuantization	CodeCode Available
Audio Spectral Enhancement: Leveraging Autoencoders for Low Latency Reconstruction of Long, Lossy Audio Sequences	Aug 8, 2021	Audio CompressionQuantization	CodeCode Available
Climate Finance Bench	May 28, 2025	Logical ReasoningQuantization	CodeCode Available
Language Models as Zero-shot Lossless Gradient Compressors: Towards General Neural Parameter Prior Models	Sep 26, 2024	Neural Network CompressionQuantization	CodeCode Available
CLAQ: Pushing the Limits of Low-Bit Post-Training Quantization for LLMs	May 27, 2024	Computational EfficiencyQuantization	CodeCode Available
Langevin dynamics based algorithm e-THO POULA for stochastic optimization problems with discontinuous stochastic gradient	Oct 24, 2022	Portfolio OptimizationQuantization	CodeCode Available
KVTuner: Sensitivity-Aware Layer-wise Mixed Precision KV Cache Quantization for Efficient and Nearly Lossless LLM Inference	Feb 6, 2025	Mathematical ReasoningQuantization	CodeCode Available
Activations and Gradients Compression for Model-Parallel Training	Jan 15, 2024	image-classificationImage Classification	CodeCode Available
Overcoming Distribution Mismatch in Quantizing Image Super-Resolution Networks	Jul 25, 2023	Image ClassificationImage Super-Resolution	CodeCode Available
Variational Inference with Latent Space Quantization for Adversarial Resilience	Mar 24, 2019	Quantizationvalid	CodeCode Available
KP2Dtiny: Quantized Neural Keypoint Detection and Description on the Edge	Jul 7, 2023	Homography EstimationKeypoint Detection	CodeCode Available
TensorQuant - A Simulation Toolbox for Deep Neural Network Quantization	Oct 13, 2017	Quantization	CodeCode Available
Real-Time Spacecraft Pose Estimation Using Mixed-Precision Quantized Neural Network on COTS Reconfigurable MPSoC	Jun 6, 2024	Pose EstimationQuantization	CodeCode Available
U-Net Fixed-Point Quantization for Medical Image Segmentation	Aug 2, 2019	Image SegmentationMedical Image Segmentation	CodeCode Available
Efficient Large-scale Approximate Nearest Neighbor Search on the GPU	Feb 20, 2017	CPUGPU	CodeCode Available
Addition is almost all you need: Compressing neural networks with double binary factorization	May 16, 2025	AllBinarization	CodeCode Available
Just Round: Quantized Observation Spaces Enable Memory Efficient Learning of Dynamic Locomotion	Oct 14, 2022	Deep Reinforcement LearningQuantization	CodeCode Available
JPEG Inspired Deep Learning	Oct 9, 2024	Deep LearningFine-Grained Image Classification	CodeCode Available
Joint Pruning and Channel-wise Mixed-Precision Quantization for Efficient Deep Neural Networks	Jul 1, 2024	Quantization	CodeCode Available
Deep Learning as a Mixed Convex-Combinatorial Optimization Problem	Oct 31, 2017	Combinatorial OptimizationDeep Learning	CodeCode Available
Deep Image Compression via End-to-End Learning	Jun 5, 2018	Image CompressionMS-SSIM	CodeCode Available
Joint Maximum Purity Forest with Application to Image Super-Resolution	Aug 30, 2017	ClusteringGeneral Classification	CodeCode Available
Efficient Integer-Arithmetic-Only Convolutional Neural Networks	Jun 21, 2020	Image Super-ResolutionQuantization	CodeCode Available
Efficient High-Resolution Template Matching with Vector Quantized Nearest Neighbour Fields	Jun 26, 2023	Image Registrationobject-detection	CodeCode Available
Deep Hashing via Householder Quantization	Nov 7, 2023	BinarizationDeep Hashing	CodeCode Available
Iterative Training: Finding Binary Weight Deep Neural Networks with Layer Binarization	Nov 13, 2021	BinarizationQuantization	CodeCode Available
I&S-ViT: An Inclusive & Stable Method for Pushing the Limit of Post-Training ViTs Quantization	Nov 16, 2023	Quantization	CodeCode Available
Is PGD-Adversarial Training Necessary? Alternative Training via a Soft-Quantization Network with Noisy-Natural Samples Only	Oct 10, 2018	Adversarial AttackQuantization	CodeCode Available
WAVEQ: GRADIENT-BASED DEEP QUANTIZATION OF NEURAL NETWORKS THROUGH SINUSOIDAL REGULARIZATION	Jan 1, 2021	Quantization	CodeCode Available
Efficient Federated Intrusion Detection in 5G ecosystem using optimized BERT-based model	Sep 28, 2024	Federated LearningIntrusion Detection	CodeCode Available
Parallel Blockwise Knowledge Distillation for Deep Neural Network Compression	Dec 5, 2020	Knowledge DistillationNeural Network Compression	CodeCode Available
Deep Convolutional AutoEncoder-based Lossy Image Compression	Apr 25, 2018	Image CompressionQuantization	CodeCode Available

Show:10 25 50

← PrevPage 93 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified