Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2901–2925 of 4925 papers

Title	Date	Tasks	Status
ReTAG: Reasoning Aware Table to Analytic Text Generation	May 19, 2023	Data-to-Text GenerationDescriptive	—Unverified
Stochastic Gradient Langevin Dynamics Based on Quantization with Increasing Resolution	May 30, 2023	Quantization	—Unverified
Stochastic Hybrid Combining Design for Quantized Massive MIMO Systems	Aug 24, 2020	QuantizationStochastic Optimization	—Unverified
Stochastic Learning Equation using Monotone Increasing Resolution of Quantization	Dec 24, 2021	global-optimizationQuantization	—Unverified
Stochastic Markov Gradient Descent and Training Low-Bit Neural Networks	Aug 25, 2020	Quantization	—Unverified
Stochastic Precision Ensemble: Self-Knowledge Distillation for Quantized Deep Neural Networks	Sep 30, 2020	image-classificationImage Classification	—Unverified
Stochastic-Sign SGD for Federated Learning with Theoretical Guarantees	Feb 25, 2020	Federated Learningparameter estimation	—Unverified
Stopping Rules for Bag-of-Words Image Search and Its Application in Appearance-Based Localization	Dec 28, 2013	Image RetrievalQuantization	—Unverified
STORE: Streamlining Semantic Tokenization and Generative Recommendation with A Single LLM	Sep 11, 2024	Language ModellingLarge Language Model	—Unverified
Straightening Out the Straight-Through Estimator: Overcoming Optimization Challenges in Vector Quantized Networks	May 15, 2023	image-classificationImage Classification	—Unverified
Strategizing against Q-learners: A Control-theoretical Approach	Mar 13, 2024	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Streaming Parrotron for on-device speech-to-speech conversion	Oct 25, 2022	CPUDecoder	—Unverified
Streamlining Tensor and Network Pruning in PyTorch	Apr 28, 2020	Model CompressionNetwork Pruning	—Unverified
Strong Solutions and Quantization-Based Numerical Schemes for a Class of Non-Markovian Volatility Models	Feb 28, 2025	Quantization	—Unverified
Structural and Statistical Texture Knowledge Distillation for Semantic Segmentation	May 6, 2023	Knowledge DistillationQuantization	—Unverified
Structural Latency Perturbation in Large Language Models Through Recursive State Induction	Feb 2, 2025	Computational EfficiencyQuantization	—Unverified
Structured adaptive and random spinners for fast machine learning computations	Oct 19, 2016	BIG-bench Machine LearningDimensionality Reduction	—Unverified
Structured Binary Neural Networks for Accurate Image Classification and Semantic Segmentation	Nov 22, 2018	General Classificationimage-classification	—Unverified
Structured Compression by Weight Encryption for Unstructured Pruning and Quantization	May 24, 2019	Model CompressionQuantization	—Unverified
Neural Language of Thought Models	Feb 2, 2024	Image GenerationObject	—Unverified
Structure Information is the Key: Self-Attention RoI Feature Extractor in 3D Object Detection	Nov 1, 2021	2D Object Detection3D Object Detection	—Unverified
Studying the Interplay between Information Loss and Operation Loss in Representations for Classification	Dec 30, 2021	FormQuantization	—Unverified
Study of Encoder-Decoder Architectures for Code-Mix Search Query Translation	Aug 7, 2022	Data AugmentationDecoder	—Unverified
Study of Energy-Efficient Distributed RLS-based Learning with Coarsely Quantized Signals	Dec 20, 2020	parameter estimationQuantization	—Unverified
Style Quantization for Data-Efficient GAN Training	Mar 31, 2025	NavigateQuantization	—Unverified

Show:10 25 50

← PrevPage 117 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified