Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1051–1100 of 4925 papers

Title	Date	Tasks	Status
3D Surface Detail Enhancement From a Single Normal Map	Oct 1, 2017	3D ReconstructionQuantization	—Unverified
Compression of Deep Neural Networks for Image Instance Retrieval	Jan 18, 2017	Image Instance RetrievalModel Compression	—Unverified
Compression of Deep Learning Models for Text: A Survey	Aug 12, 2020	Deep LearningInformation Retrieval	—Unverified
A Simple Contrastive Framework Of Item Tokenization For Generative Recommendation	Jun 20, 2025	Contrastive LearningDescriptive	—Unverified
Direct Quantization for Training Highly Accurate Low Bit-width Deep Neural Networks	Dec 26, 2020	image-classificationImage Classification	—Unverified
Compression of Deep Convolutional Neural Networks under Joint Sparsity Constraints	May 21, 2018	Quantization	—Unverified
Compression of Acoustic Event Detection Models With Quantized Distillation	Jul 1, 2019	Event DetectionKnowledge Distillation	—Unverified
A simple approach for quantizing neural networks	Sep 7, 2022	Quantization	—Unverified
Compression of Acoustic Event Detection Models with Low-rank Matrix Factorization and Quantization Training	May 2, 2019	Event DetectionQuantization	—Unverified
Compression for Better: A General and Stable Lossless Compression Framework	Dec 9, 2024	Computational EfficiencyModel Compression	—Unverified
A Silicon Photonic Accelerator for Convolutional Neural Networks with Heterogeneous Quantization	May 17, 2022	Quantization	—Unverified
Accuracy is Not All You Need	Jul 12, 2024	AllQuantization	—Unverified
DI-Retinex: Digital-Imaging Retinex Theory for Low-Light Image Enhancement	Apr 4, 2024	Image EnhancementLow-Light Image Enhancement	—Unverified
Compression-based Privacy Preservation for Distributed Nash Equilibrium Seeking in Aggregative Games	May 6, 2024	Quantization	—Unverified
A Short Note on Analyzing Sequence Complexity in Trajectory Prediction Benchmarks	Mar 27, 2020	QuantizationTrajectory Prediction	—Unverified
Adversarial Defenses via Vector Quantization	May 23, 2023	Quantization	—Unverified
Compressing Weight-updates for Image Artifacts Removal Neural Networks	May 10, 2019	DecoderImage Compression	—Unverified
A SER-based Device Selection Mechanism in Multi-bits Quantization Federated Learning	Apr 20, 2024	Federated LearningQuantization	—Unverified
Dimension-Free Bounds for Low-Precision Training	May 1, 2019	Quantization	—Unverified
ASER: Activation Smoothing and Error Reconstruction for Large Language Model Quantization	Nov 12, 2024	Language ModelingLanguage Modelling	—Unverified
Compressing VAE-Based Out-of-Distribution Detectors for Embedded Deployment	Sep 2, 2024	CPUGPU	—Unverified
Adversarial Attack on Deep Product Quantization Network for Image Retrieval	Feb 26, 2020	Adversarial AttackImage Retrieval	—Unverified
Compressing Unknown Images With Product Quantizer for Efficient Zero-Shot Classification	Jun 1, 2019	General ClassificationGeneralized Zero-Shot Learning	—Unverified
Compressing Recurrent Neural Networks for FPGA-accelerated Implementation in Fluorescence Lifetime Imaging	Oct 1, 2024	Computational EfficiencyKnowledge Distillation	—Unverified
A Secure Federated Learning Framework for Residential Short Term Load Forecasting	Sep 29, 2022	Demand ForecastingFederated Learning	—Unverified
Accumulator-Aware Post-Training Quantization	Sep 25, 2024	image-classificationImage Classification	—Unverified
DipSVD: Dual-importance Protected SVD for Efficient LLM Compression	Jun 25, 2025	Model CompressionQuantization	—Unverified
Dirichlet Mixture Model based VQ Performance Prediction for Line Spectral Frequency	Aug 2, 2018	Quantization	—Unverified
Compressing Pre-trained Transformers via Low-Bit NxM Sparsity for Natural Language Understanding	Jun 30, 2022	Natural Language UnderstandingQuantization	—Unverified
Compressing Neural Machine Translation Models with 4-bit Precision	Jul 1, 2020	Machine TranslationNMT	—Unverified
A-SDM: Accelerating Stable Diffusion through Redundancy Removal and Performance Optimization	Dec 24, 2023	Quantization	—Unverified
Compressing Low Precision Deep Neural Networks Using Sparsity-Induced Regularization in Ternary Networks	Sep 19, 2017	L2 RegularizationModel Compression	—Unverified
A Safe Self-evolution Algorithm for Autonomous Driving Based on Data-Driven Risk Quantification Model	Aug 23, 2024	Autonomous DrivingEvolutionary Algorithms	—Unverified
Compressing Language Models for Specialized Domains	Feb 25, 2025	Quantization	—Unverified
Artificial neural networks condensation: A strategy to facilitate adaption of machine learning in medical settings by reducing computational burden	Dec 23, 2018	Computational EfficiencyMortality Prediction	—Unverified
Compressing Deep Convolutional Networks using Vector Quantization	Dec 18, 2014	ClassificationClustering	—Unverified
Art and Science of Quantizing Large-Scale Models: A Comprehensive Overview	Sep 18, 2024	Quantization	—Unverified
3D representation in 512-Byte:Variational tokenizer is the key for autoregressive 3D generation	Dec 3, 2024	3D GenerationImage Generation	—Unverified
DILEMMA: Joint LLM Quantization and Distributed LLM Inference Over Edge Computing Systems	Mar 3, 2025	Edge-computingKnowledge Distillation	—Unverified
Compressed Video Super-Resolution based on Hierarchical Encoding	Jun 17, 2025	QuantizationSuper-Resolution	—Unverified
Compressed-VFL: Communication-Efficient Learning with Vertically Partitioned Data	Jun 16, 2022	Federated LearningQuantization	—Unverified
Compressed Particle-Based Federated Bayesian Learning and Unlearning	Sep 14, 2022	Quantization	—Unverified
ARQ: A Mixed-Precision Quantization Framework for Accurate and Certifiably Robust DNNs	Oct 31, 2024	Quantization	—Unverified
1-bit Localization Scheme for Radar using Dithered Quantized Compressed Sensing	Jun 15, 2018	compressed sensingQuantization	—Unverified
Compressed Models Decompress Race Biases: What Quantized Models Forget for Fair Face Recognition	Aug 23, 2023	Face RecognitionQuantization	—Unverified
Compressed Domain Prior-Guided Video Super-Resolution for Cloud Gaming Content	Jan 3, 2025	QuantizationSuper-Resolution	—Unverified
A Robust Visual Sampling Model Inspired by Receptive Field	Jan 4, 2022	Quantization	—Unverified
A Robust Deep Learning-Based Beamforming Design for RIS-assisted Multiuser MISO Communications with Practical Constraints	Nov 12, 2021	Quantization	—Unverified
AdpQ: A Zero-shot Calibration Free Adaptive Post Training Quantization Method for LLMs	May 22, 2024	Privacy PreservingQuantization	—Unverified
DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation	Sep 22, 2024	Image GenerationKnowledge Distillation	—Unverified

Show:10 25 50

← PrevPage 22 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified