Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1151–1200 of 4925 papers

Title	Date	Tasks	Status	Score
Leveraging Continuously Differentiable Activation Functions for Learning in Quantized Noisy Environments	Feb 4, 2024	Quantization	CodeCode Available	5
Learning Frequency-Specific Quantization Scaling in VVC for Standard-Compliant Task-driven Image Coding	Jan 20, 2023	Quantization	CodeCode Available	5
Learning Convolutional Transforms for Lossy Point Cloud Geometry Compression	Mar 20, 2019	Binary ClassificationMixed Reality	CodeCode Available	5
Learning Compression from Limited Unlabeled Data	Sep 1, 2018	CPUGPU	CodeCode Available	5
Learning Bag-of-Features Pooling for Deep Convolutional Neural Networks	Jul 25, 2017	General ClassificationQuantization	CodeCode Available	5
Learning Accurate Low-Bit Deep Neural Networks with Stochastic Quantization	Aug 3, 2017	Quantization	CodeCode Available	5
Learning Accurate Performance Predictors for Ultrafast Automated Model Compression	Apr 13, 2023	image-classificationImage Classification	CodeCode Available	5
Learning compact binary descriptors with unsupervised deep neural networks	Jun 1, 2016	Image RetrievalObject	CodeCode Available	5
Adaptive Computation Modules: Granular Conditional Computation For Efficient Inference	Dec 15, 2023	Quantizationspeech-recognition	CodeCode Available	5
An Integrated Approach to Produce Robust Models with High Efficiency	Aug 31, 2020	QuantizationVocal Bursts Intensity Prediction	CodeCode Available	5
An Information-Theoretic Analysis of Self-supervised Discrete Representations of Speech	Jun 4, 2023	QuantizationRepresentation Learning	CodeCode Available	5
Boosting CNN-based primary quantization matrix estimation of double JPEG images via a classification-like architecture	Dec 1, 2020	Image ForensicsQuantization	CodeCode Available	5
Language Models as Zero-shot Lossless Gradient Compressors: Towards General Neural Parameter Prior Models	Sep 26, 2024	Neural Network CompressionQuantization	CodeCode Available	5
Learned transform compression with optimized entropy encoding	Apr 7, 2021	Quantization	CodeCode Available	5
Learning Physical-Layer Communication with Quantized Feedback	Apr 19, 2019	Quantization	CodeCode Available	5
Linearly Converging Error Compensated SGD	Oct 23, 2020	Quantization	CodeCode Available	5
KP2Dtiny: Quantized Neural Keypoint Detection and Description on the Edge	Jul 7, 2023	Homography EstimationKeypoint Detection	CodeCode Available	5
KVTuner: Sensitivity-Aware Layer-wise Mixed Precision KV Cache Quantization for Efficient and Nearly Lossless LLM Inference	Feb 6, 2025	Mathematical ReasoningQuantization	CodeCode Available	5
JPEG Inspired Deep Learning	Oct 9, 2024	Deep LearningFine-Grained Image Classification	CodeCode Available	5
BlockDialect: Block-wise Fine-grained Mixed Format Quantization for Energy-Efficient LLM Inference	Jan 2, 2025	Quantization	CodeCode Available	5
Joint Pruning and Channel-wise Mixed-Precision Quantization for Efficient Deep Neural Networks	Jul 1, 2024	Quantization	CodeCode Available	5
An exploration of the effect of quantisation on energy consumption and inference time of StarCoder2	Nov 15, 2024	Model CompressionQuantization	CodeCode Available	5
Joint Maximum Purity Forest with Application to Image Super-Resolution	Aug 30, 2017	ClusteringGeneral Classification	CodeCode Available	5
Just Round: Quantized Observation Spaces Enable Memory Efficient Learning of Dynamic Locomotion	Oct 14, 2022	Deep Reinforcement LearningQuantization	CodeCode Available	5
Langevin dynamics based algorithm e-THO POULA for stochastic optimization problems with discontinuous stochastic gradient	Oct 24, 2022	Portfolio OptimizationQuantization	CodeCode Available	5
Iterative Training: Finding Binary Weight Deep Neural Networks with Layer Binarization	Nov 13, 2021	BinarizationQuantization	CodeCode Available	5
Is PGD-Adversarial Training Necessary? Alternative Training via a Soft-Quantization Network with Noisy-Natural Samples Only	Oct 10, 2018	Adversarial AttackQuantization	CodeCode Available	5
IR2Net: Information Restriction and Information Recovery for Accurate Binary Neural Networks	Oct 6, 2022	BinarizationQuantization	CodeCode Available	5
Forward and Backward Information Retention for Accurate Binary Neural Networks	Sep 24, 2019	BinarizationNeural Network Compression	CodeCode Available	5
I&S-ViT: An Inclusive & Stable Method for Pushing the Limit of Post-Training ViTs Quantization	Nov 16, 2023	Quantization	CodeCode Available	5
BitMoD: Bit-serial Mixture-of-Datatype LLM Acceleration	Nov 18, 2024	Quantization	CodeCode Available	5
Integral Human Pose Regression	Nov 22, 2017	3D Human Pose Estimation3D Pose Estimation	CodeCode Available	5
Integer Quantization for Deep Learning Inference: Principles and Empirical Evaluation	Apr 20, 2020	Deep LearningMath	CodeCode Available	5
Integrated Encoding and Quantization to Enhance Quanvolutional Neural Networks	Oct 8, 2024	QuantizationQuantum Machine Learning	CodeCode Available	5
Investigating the Impact of Quantization Methods on the Safety and Reliability of Large Language Models	Feb 18, 2025	Quantization	CodeCode Available	5
FTBNN: Rethinking Non-linearity for 1-bit CNNs and Going Beyond	Oct 19, 2020	Image ClassificationQuantization	CodeCode Available	5
Instance-Aware Dynamic Neural Network Quantization	Jan 1, 2022	Quantization	CodeCode Available	5
Improving Self-Supervised Learning-based MOS Prediction Networks	Apr 23, 2022	PredictionQuantization	CodeCode Available	5
In-Context Learning for MIMO Equalization Using Transformer-Based Sequence Models	Nov 10, 2023	In-Context LearningMeta-Learning	CodeCode Available	5
Incremental Network Quantization: Towards Lossless CNNs with Low-Precision Weights	Feb 10, 2017	Quantization	CodeCode Available	5
Improving Neural Network Quantization without Retraining using Outlier Channel Splitting	Jan 28, 2019	Language ModelingLanguage Modelling	CodeCode Available	5
AdaBits: Neural Network Quantization with Adaptive Bit-Widths	Dec 20, 2019	Quantization	CodeCode Available	5
BinaryRelax: A Relaxation Approach For Training Deep Neural Networks With Quantized Weights	Jan 19, 2018	Quantization	CodeCode Available	5
An efficient and straightforward online quantization method for a data stream through remove-birth updating	Jun 21, 2023	Drift DetectionQuantization	CodeCode Available	5
AdaBin: Improving Binary Neural Networks with Adaptive Binary Sets	Aug 17, 2022	Classification with Binary Neural NetworkQuantization	CodeCode Available	5
An Edge Computing-Based Solution for Real-Time Leaf Disease Classification using Thermal Imaging	Nov 6, 2024	Deep LearningEdge-computing	CodeCode Available	5
Improved Gradient based Adversarial Attacks for Quantized Networks	Mar 30, 2020	image-classificationImage Classification	CodeCode Available	5
Improved Knowledge Distillation for Crowd Counting on IoT Device	Aug 2, 2023	Crowd CountingKnowledge Distillation	CodeCode Available	5
Improving Robustness Against Stealthy Weight Bit-Flip Attacks by Output Code Matching	Jan 1, 2022	Quantization	CodeCode Available	5
Image Hashing by Minimizing Discrete Component-wise Wasserstein Distance	Feb 29, 2020	Image RetrievalQuantization	CodeCode Available	5

Show:10 25 50

← PrevPage 24 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified