Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2751–2775 of 4925 papers

Title	Date	Tasks	Status
Selective Focus: Investigating Semantics Sensitivity in Post-training Quantization for Lane Detection	May 10, 2024	Autonomous DrivingGPU	—Unverified
Self-Adaptable Templates for Feature Coding	Dec 1, 2014	image-classificationImage Classification	—Unverified
Self-calibration for Language Model Quantization and Pruning	Oct 22, 2024	Language ModelingLanguage Modelling	—Unverified
Self-control: A Better Conditional Mechanism for Masked Autoregressive Model	Dec 18, 2024	Conditional Image GenerationImage Generation	—Unverified
Self-Distilled Quantization: Achieving High Compression Rates in Transformer-Based Language Models	Jul 12, 2023	QuantizationXLM-R	—Unverified
Self-Supervised Consistent Quantization for Fully Unsupervised Image Retrieval	Jun 20, 2022	Contrastive LearningImage Retrieval	—Unverified
Self-triggered Consensus of Multi-agent Systems with Quantized Relative State Measurements	Oct 6, 2022	Quantization	—Unverified
Semantic and Effective Communication for Remote Control Tasks with Dynamic Feature Compression	Jan 14, 2023	Deep Reinforcement LearningFeature Compression	—Unverified
Semantic Certainty Assessment in Vector Retrieval Systems: A Novel Framework for Embedding Quality Evaluation	Jul 8, 2025	Data AugmentationQuantization	—Unverified
Semantic Residual for Multimodal Unified Discrete Representation	Dec 26, 2024	DisentanglementQuantization	—Unverified
Semantic Retention and Extreme Compression in LLMs: Can We Have Both?	May 12, 2025	Language ModelingLanguage Modelling	—Unverified
Semantics Prompting Data-Free Quantization for Low-Bit Vision Transformers	Dec 21, 2024	Data Free QuantizationModel Compression	—Unverified
Semantic Text Compression for Classification	Sep 19, 2023	ClassificationDecoder	—Unverified
Semi-Blind Post-Equalizer SINR Estimation and Dual CSI Feedback for Radar-Cellular Coexistence	Jun 2, 2020	QuantizationScheduling	—Unverified
SEMINAR: Search Enhanced Multi-modal Interest Network and Approximate Retrieval for Lifelong Sequential Recommendation	Jul 15, 2024	Click-Through Rate PredictionQuantization	—Unverified
Semi-Relaxed Quantization with DropBits: Training Low-Bit Neural Networks via Bit-wise Regularization	Nov 29, 2019	Quantization	—Unverified
Semi-Relaxed Quantization with DropBits: Training Low-Bit Neural Networks via Bitwise Regularization	Jan 1, 2021	Quantization	—Unverified
Semi-supervised Vector-Quantization in Visual SLAM using HGCN	Jul 14, 2022	Decision MakingLoop Closure Detection	—Unverified
Sensitivity-Aware Finetuning for Accuracy Recovery on Deep Learning Hardware	Jun 5, 2023	Deep LearningQuantization	—Unverified
Sensitivity-Aware Mixed-Precision Quantization and Width Optimization of Deep Neural Networks Through Cluster-Based Tree-Structured Parzen Estimation	Aug 12, 2023	QuantizationSensitivity	—Unverified
SensorChat: Answering Qualitative and Quantitative Questions during Long-Term Multimodal Sensor Interactions	Feb 5, 2025	QuantizationQuestion Answering	—Unverified
Sensor Selection and Distributed Quantization for Energy Efficiency in Massive MTC	Dec 7, 2024	Quantization	—Unverified
SEP-Nets: Small and Effective Pattern Networks	Jun 13, 2017	BinarizationQuantization	—Unverified
SeRP: Self-Supervised Representation Learning Using Perturbed Point Clouds	Sep 13, 2022	DecoderQuantization	—Unverified
Service Delay Minimization for Federated Learning over Mobile Devices	May 19, 2022	Federated LearningQuantization	—Unverified

Show:10 25 50

← PrevPage 111 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified