Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4851–4900 of 4925 papers

Title	Date	Tasks	Status
Hardening DNNs against Transfer Attacks during Network Compression using Greedy Adversarial Pruning	Jun 15, 2022	Adversarial RobustnessQuantization	CodeCode Available
PsyLite Technical Report	Jun 26, 2025	Large Language ModelLightweight Deployment	CodeCode Available
Guetzli: Perceptually Guided JPEG Encoder	Mar 13, 2017	Perceptual DistanceQuantization	CodeCode Available
DoReFa-Net: Training Low Bitwidth Convolutional Neural Networks with Low Bitwidth Gradients	Jun 20, 2016	CPUGPU	CodeCode Available
GT-SVQ: A Linear-Time Graph Transformer for Node Classification Using Spiking Vector Quantization	Apr 16, 2025	Graph LearningGraph Representation Learning	CodeCode Available
PTQ4RIS: Post-Training Quantization for Referring Image Segmentation	Sep 25, 2024	Image SegmentationQuantization	CodeCode Available
GSB: Group Superposition Binarization for Vision Transformer with Limited Training Samples	May 13, 2023	BinarizationKnowledge Distillation	CodeCode Available
GraNNite: Enabling High-Performance Execution of Graph Neural Networks on Resource-Constrained Neural Processing Units	Feb 10, 2025	Event-based visionQuantization	CodeCode Available
GQFedWAvg: Optimization-Based Quantized Federated Learning in General Edge Computing Systems	Jun 13, 2023	Edge-computingFederated Learning	CodeCode Available
Goten: GPU-Outsourcing Trusted Execution of Neural Network Training and Prediction	Sep 25, 2019	GPUPrivacy Preserving	CodeCode Available
Don't take it lightly: Phasing optical random projections with unknown operators	Jul 3, 2019	CPUGPU	CodeCode Available
The ZipML Framework for Training Models with End-to-End Low Precision: The Cans, the Cannots, and a Little Bit of Deep Learning	Nov 16, 2016	Quantization	CodeCode Available
Pufferfish: Communication-efficient Models At No Extra Cost	Mar 5, 2021	Quantization	CodeCode Available
PUGAN: Physical Model-Guided Underwater Image Enhancement Using GAN with Dual-Discriminators	Jun 15, 2023	Image EnhancementQuantization	CodeCode Available
PULP-NN: Accelerating Quantized Neural Networks on Parallel Ultra-Low-Power RISC-V Processors	Aug 29, 2019	Quantization	CodeCode Available
RNN-SM: Fast Steganalysis of VoIP Streams Using Recurrent Neural Network	Feb 15, 2018	QuantizationSteganalysis	CodeCode Available
Content-Aware Radiance Fields: Aligning Model Complexity with Scene Intricacy Through Learned Bitwidth Quantization	Oct 25, 2024	NeRFQuantization	CodeCode Available
Robust and Communication-Efficient Collaborative Learning	Jul 24, 2019	Quantization	CodeCode Available
Thinking in Granularity: Dynamic Quantization for Image Super-Resolution by Intriguing Multi-Granularity Clues	Sep 22, 2024	Image Super-ResolutionQuantization	CodeCode Available
Unlocking Data-free Low-bit Quantization with Matrix Decomposition for KV Cache Compression	May 21, 2024	QuantizationTensor Decomposition	CodeCode Available
Robust Clustering on High-Dimensional Data with Stochastic Quantization	Sep 3, 2024	ClusteringComputational Efficiency	CodeCode Available
GIFT-SW: Gaussian noise Injected Fine-Tuning of Salient Weights for LLMs	Aug 27, 2024	parameter-efficient fine-tuningQuantization	CodeCode Available
Conformalized High-Density Quantile Regression via Dynamic Prototypes-based Probability Density Estimation	Nov 2, 2024	Density Estimationquantile regression	CodeCode Available
Approximate Message Passing with Parameter Estimation for Heavily Quantized Measurements	May 20, 2022	Computational Efficiencyparameter estimation	CodeCode Available
Genie: Show Me the Data for Quantization	Dec 9, 2022	Data Free QuantizationQuantization	CodeCode Available
General Point Model Pretraining with Autoencoding and Autoregressive	Jan 1, 2024	DecoderLanguage Modeling	CodeCode Available
Conditional Probability Models for Deep Image Compression	Jan 12, 2018	Image CompressionMS-SSIM	CodeCode Available
Applying generative neural networks for fast simulations of the ALICE (CERN) experiment	Jul 10, 2024	Quantization	CodeCode Available
Computational data analysis for first quantization estimation on JPEG double compressed images	Jan 10, 2021	Quantization	CodeCode Available
Compressing Word Embeddings via Deep Compositional Code Learning	Nov 3, 2017	Machine TranslationQuantization	CodeCode Available
Generalized Relevance Learning Grassmann Quantization	Mar 14, 2024	Activity RecognitionFace Recognition	CodeCode Available
Fate: Fast Edge Inference of Mixture-of-Experts Models via Cross-Layer Gate	Feb 17, 2025	GPUMixture-of-Experts	CodeCode Available
Generalized Learning Vector Quantization for Classification in Randomized Neural Networks and Hyperdimensional Computing	Jun 17, 2021	BIG-bench Machine LearningQuantization	CodeCode Available
Robustness Analysis of Deep Learning Frameworks on Mobile Platforms	Sep 20, 2021	BIG-bench Machine LearningDeep Learning	CodeCode Available
GANQ: GPU-Adaptive Non-Uniform Quantization for Large Language Models	Jan 22, 2025	GPUQuantization	CodeCode Available
FTT-NAS: Discovering Fault-Tolerant Convolutional Neural Architecture	Mar 20, 2020	Neural Architecture SearchQuantization	CodeCode Available
FPQVAR: Floating Point Quantization for Visual Autoregressive Model with FPGA Hardware Co-design	May 22, 2025	GPUImage Generation	CodeCode Available
FP4DiT: Towards Effective Floating Point Quantization for Diffusion Transformers	Mar 19, 2025	Image GenerationQuantization	CodeCode Available
Compressing Vision Transformers for Low-Resource Visual Learning	Sep 5, 2023	Autonomous Navigationimage-classification	CodeCode Available
Does quantization affect models' performance on long-context tasks?	May 26, 2025	Quantization	CodeCode Available
Dequantization and Color Transfer with Diffusion Models	Jul 6, 2023	ColorizationImage Colorization	CodeCode Available
Accurate and Efficient Fine-Tuning of Quantized Large Language Models Through Optimal Balance	Jul 24, 2024	Quantization	CodeCode Available
Foundations of Large Language Model Compression -- Part 1: Weight Quantization	Sep 3, 2024	Language ModelingLanguage Modelling	CodeCode Available
Robustness of Generalized Learning Vector Quantization Models against Adversarial Attacks	Feb 1, 2019	Quantization	CodeCode Available
Q&C: When Quantization Meets Cache in Efficient Image Generation	Mar 4, 2025	Image GenerationQuantization	CodeCode Available
ACCEPT: Adaptive Codebook for Composite and Efficient Prompt Tuning	Oct 10, 2024	Natural Language Understandingparameter-efficient fine-tuning	CodeCode Available
FLoCoRA: Federated learning compression with low-rank adaptation	Jun 20, 2024	Federated LearningModel Compression	CodeCode Available
Floating-Point Quantization Analysis of Multi-Layer Perceptron Artificial Neural Networks	Mar 18, 2024	Quantization	CodeCode Available
FlexRound: Learnable Rounding based on Element-wise Division for Post-Training Quantization	Jun 1, 2023	image-classificationImage Classification	CodeCode Available
Flexible Mixed Precision Quantization for Learned Image Compression	Jun 2, 2025	Image CompressionQuantization	CodeCode Available

Show:10 25 50

← PrevPage 98 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified