Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4401–4450 of 4925 papers

Title	Date	Tasks	Status
Low-complexity acoustic scene classification for multi-device audio: analysis of DCASE 2021 Challenge systems	May 28, 2021	Acoustic Scene ClassificationQuantization	CodeCode Available
Zero-Shot Dynamic Quantization for Transformer Inference	Nov 17, 2022	Quantization	CodeCode Available
Differentiable Product Quantization for Memory Efficient Camera Relocalization	Jul 22, 2024	Camera RelocalizationQuantization	CodeCode Available
Low-bit Quantization of Neural Networks for Efficient Inference	Feb 18, 2019	Quantization	CodeCode Available
NIF: A Fast Implicit Image Compression with Bottleneck Layers and Modulated Sinusoidal Activations	Oct 27, 2023	Image CompressionQuantization	CodeCode Available
Low-bit Quantization for Deep Graph Neural Networks with Smoothness-aware Message Propagation	Aug 29, 2023	Graph Neural NetworkNode Classification	CodeCode Available
NIRVANA: Neural Implicit Representations of Videos with Adaptive Networks and Autoregressive Patch-wise Modeling	Dec 30, 2022	QuantizationVideo Compression	CodeCode Available
NITRO-D: Native Integer-only Training of Deep Convolutional Neural Networks	Jul 16, 2024	Quantization	CodeCode Available
Noise Invariant Frame Selection: A Simple Method to Address the Background Noise Problem for Text-independent Speaker Verification	May 3, 2018	QuantizationSpeaker Verification	CodeCode Available
Differentiable Fine-grained Quantization for Deep Neural Network Compression	Oct 20, 2018	Neural Network CompressionQuantization	CodeCode Available
Device-friendly Guava fruit and leaf disease detection using deep learning	Sep 26, 2022	DiagnosticModel Optimization	CodeCode Available
Towards Accurate Post-training Quantization for Reparameterized Models	Feb 25, 2024	Quantization	CodeCode Available
NoisyDECOLLE: Robust Local Learning for SNNs on Neuromorphic Hardware	Mar 19, 2024	Quantization	CodeCode Available
Development, Optimization, and Deployment of Thermal Forward Vision Systems for Advance Vehicular Applications on Edge Devices	Jan 18, 2023	Model Optimizationobject-detection	CodeCode Available
Low-bit Model Quantization for Deep Neural Networks: A Survey	May 8, 2025	Quantization	CodeCode Available
LoTA-QAF: Lossless Ternary Adaptation for Quantization-Aware Fine-Tuning	May 24, 2025	Computational EfficiencyMMLU	CodeCode Available
Sub-token ViT Embedding via Stochastic Resonance Transformers	Oct 6, 2023	Depth EstimationDepth Prediction	CodeCode Available
What if Adversarial Samples were Digital Images	May 13, 2020	Quantization	CodeCode Available
Summary Statistic Privacy in Data Sharing	Mar 3, 2023	Quantization	CodeCode Available
Exploiting vulnerabilities of deep neural networks for privacy protection	Jul 19, 2020	Adversarial AttackQuantization	CodeCode Available
Victoria Amazonica Optimization (VAO): An Algorithm Inspired by the Giant Water Lily Plant	Jan 22, 2023	feature selectionImage Segmentation	CodeCode Available
Detection of Structural Change in Geographic Regions of Interest by Self Organized Mapping: Las Vegas City and Lake Mead across the Years	Mar 29, 2018	QuantizationTime Series	CodeCode Available
Loss Landscape Analysis for Reliable Quantized ML Models for Scientific Sensing	Feb 12, 2025	Quantization	CodeCode Available
Towards Alternative Techniques for Improving Adversarial Robustness: Analysis of Adversarial Training at a Spectrum of Perturbations	Jun 13, 2022	Adversarial RobustnessQuantization	CodeCode Available
VideoBERT: A Joint Model for Video and Language Representation Learning	Apr 3, 2019	Action ClassificationGeneral Classification	CodeCode Available
Normalization Helps Training of Quantized LSTM	Dec 1, 2019	Quantization	CodeCode Available
Norm-Explicit Quantization: Improving Vector Quantization for Maximum Inner Product Search	Nov 12, 2019	Data CompressionQuantization	CodeCode Available
Accelerating Error Correction Code Transformers	Oct 8, 2024	Quantization	CodeCode Available
Loss-aware Weight Quantization of Deep Networks	Feb 23, 2018	BinarizationQuantization	CodeCode Available
Winner-takes-all learners are geometry-aware conditional density estimators	Jun 7, 2024	AllDensity Estimation	CodeCode Available
Conditional COT-GAN for Video Prediction with Kernel Smoothing	Jun 10, 2021	PredictionQuantization	CodeCode Available
Loss Aware Post-training Quantization	Nov 17, 2019	Quantization	CodeCode Available
A Bag-of-Words Equivalent Recurrent Neural Network for Action Recognition	Mar 23, 2017	Action RecognitionGeneral Classification	CodeCode Available
BASQ: Branch-wise Activation-clipping Search Quantization for Sub-4-bit Neural Networks	Oct 23, 2022	Neural Architecture SearchQuantization	CodeCode Available
Log-Time K-Means Clustering for 1D Data: Novel Approaches with Proof and Implementation	Dec 19, 2024	ClusteringQuantization	CodeCode Available
Detection of extragalactic Ultra-Compact Dwarfs and Globular Clusters using Explainable AI techniques	Jan 5, 2022	Feature ImportanceQuantization	CodeCode Available
What Do Compressed Deep Neural Networks Forget?	Nov 13, 2019	FairnessInterpretability Techniques for Deep Learning	CodeCode Available
LiteVAR: Compressing Visual Autoregressive Modelling with Efficient Attention and Quantization	Nov 26, 2024	Image GenerationQuantization	CodeCode Available
NUQSGD: Improved Communication Efficiency for Data-parallel SGD via Nonuniform Quantization	Aug 16, 2019	Quantization	CodeCode Available
Multimodal Unsupervised Domain Generalization by Retrieving Across the Modality Gap	Feb 6, 2024	Domain GeneralizationQuantization	CodeCode Available
Towards Effective Low-bitwidth Convolutional Neural Networks	Nov 1, 2017	Quantization	CodeCode Available
LiteLMGuard: Seamless and Lightweight On-Device Prompt Filtering for Safeguarding Small Language Models against Quantization-induced Risks and Vulnerabilities	May 8, 2025	FairnessQuantization	CodeCode Available
Detecting Adversarial Image Examples in Deep Networks with Adaptive Noise Reduction	May 23, 2017	Quantization	CodeCode Available
Towards Efficient Active Learning of PDFA	Jun 17, 2022	Active LearningQuantization	CodeCode Available
Exploiting the Partly Scratch-off Lottery Ticket for Quantization-Aware Training	Nov 12, 2022	Quantization	CodeCode Available
Adaptive Prediction-Powered AutoEval with Reliability and Efficiency Guarantees	May 24, 2025	Quantization	CodeCode Available
Depthwise Discrete Representation Learning	Apr 11, 2020	QuantizationRepresentation Learning	CodeCode Available
LISA: Learning Interpretable Skill Abstractions from Language	Feb 28, 2022	Decision MakingImitation Learning	CodeCode Available
A2Q+: Improving Accumulator-Aware Weight Quantization	Jan 19, 2024	Quantization	CodeCode Available
Denoising Noisy Neural Networks: A Bayesian Approach with Compensation	May 22, 2021	DenoisingQuantization	CodeCode Available

Show:10 25 50

← PrevPage 89 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified