Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4551–4575 of 4925 papers

Title	Date	Tasks	Status
Deep Metric Learning to Rank	Jun 1, 2019	Image RetrievalLearning-To-Rank	CodeCode Available
Learning to Seek: Autonomous Source Seeking with Deep Reinforcement Learning Onboard a Nano Drone Microcontroller	Sep 25, 2019	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available
Layer-Wise Quantization: A Pragmatic and Effective Method for Quantizing LLMs Beyond Integer Bit-Levels	Jun 25, 2024	Language ModellingLarge Language Model	CodeCode Available
AdaBin: Improving Binary Neural Networks with Adaptive Binary Sets	Aug 17, 2022	Classification with Binary Neural NetworkQuantization	CodeCode Available
Empirical Evaluation of Deep Learning Model Compression Techniques on the WaveNet Vocoder	Nov 20, 2020	Model CompressionQuantization	CodeCode Available
PLUM: Improving Inference Efficiency By Leveraging Repetition-Sparsity Trade-Off	Dec 4, 2023	BinarizationComputational Efficiency	CodeCode Available
SignSGD with Federated Defense: Harnessing Adversarial Attacks through Gradient Sign Decoding	Feb 2, 2024	Adversarial AttackQuantization	CodeCode Available
Open-source FPGA-ML codesign for the MLPerf Tiny Benchmark	Jun 23, 2022	Anomaly Detectionimage-classification	CodeCode Available
Learning Space Partitions for Nearest Neighbor Search	Jan 24, 2019	General Classificationgraph partitioning	CodeCode Available
Random and Adversarial Bit Error Robustness: Energy-Efficient and Secure DNN Accelerators	Apr 16, 2021	Quantization	CodeCode Available
Operations Guided Neural Networks for High Fidelity Data-To-Text Generation	Sep 8, 2018	Data-to-Text GenerationDecoder	CodeCode Available
SignSGD with Federated Voting	Mar 25, 2024	Quantization	CodeCode Available
Random Entity Quantization for Parameter-Efficient Compositional Knowledge Graph Representation	Oct 24, 2023	Knowledge GraphsQuantization	CodeCode Available
EmbBERT-Q: Breaking Memory Barriers in Embedded NLP	Feb 14, 2025	MambaQuantization	CodeCode Available
Randomized Quantization is All You Need for Differential Privacy in Federated Learning	Jun 20, 2023	AllFederated Learning	CodeCode Available
Automatic Neural Network Compression by Sparsity-Quantization Joint Learning: A Constrained Optimization-based Approach	Oct 14, 2019	Neural Network CompressionQuantization	CodeCode Available
Elastic Product Quantization for Time Series	Jan 4, 2022	QuantizationTime Series	CodeCode Available
Learning Semantic Textual Similarity via Topic-informed Discrete Latent Variables	Nov 7, 2022	Language ModelingLanguage Modelling	CodeCode Available
Optimal Clipping and Magnitude-aware Differentiation for Improved Quantization-aware Training	Jun 13, 2022	Quantization	CodeCode Available
Task-Based Graph Signal Compression	Oct 24, 2021	Quantization	CodeCode Available
Unconditional Image-Text Pair Generation with Multimodal Cross Quantizer	Apr 15, 2022	multimodal generationQuantization	CodeCode Available
Deep Log-Likelihood Ratio Quantization	Mar 11, 2019	DecoderQuantization	CodeCode Available
Learning Physical-Layer Communication with Quantized Feedback	Apr 19, 2019	Quantization	CodeCode Available
Deep Learning with Low Precision by Half-wave Gaussian Quantization	Feb 3, 2017	Deep LearningQuantization	CodeCode Available
Efficiera Residual Networks: Hardware-Friendly Fully Binary Weight with 2-bit Activation Model Achieves Practical ImageNet Accuracy	Oct 15, 2024	BinarizationClassification with Binary Weight Network	CodeCode Available

Show:10 25 50

← PrevPage 183 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified