Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2126–2150 of 4925 papers

Title	Date	Tasks	Status
Collaborative Automotive Radar Sensing via Mixed-Precision Distributed Array Completion	Mar 13, 2024	Matrix CompletionQuantization	—Unverified
Vector Quantization for Deep-Learning-Based CSI Feedback in Massive MIMO Systems	Mar 12, 2024	Quantization	—Unverified
Approaching Rate-Distortion Limits in Neural Compression with Lattice Transform Coding	Mar 12, 2024	Quantization	—Unverified
FlowVQTalker: High-Quality Emotional Talking Face Generation through Normalizing Flow and Quantization	Mar 11, 2024	Face GenerationQuantization	—Unverified
What Makes Quantization for Large Language Models Hard? An Empirical Study from the Lens of Perturbation	Mar 11, 2024	Computational EfficiencyQuantization	—Unverified
QuantTune: Optimizing Model Quantization with Adaptive Outlier-Driven Fine Tuning	Mar 11, 2024	Quantization	—Unverified
Enhancing Multimodal Unified Representations for Cross Modal Generalization	Mar 8, 2024	Contrastive LearningDisentanglement	—Unverified
Micro-Fracture Detection in Photovoltaic Cells with Hardware-Constrained Devices and Computer Vision	Mar 8, 2024	Fracture detectionQuantization	—Unverified
The Impact of Quantization on the Robustness of Transformer-based Text Classifiers	Mar 8, 2024	QuantizationSST-2	—Unverified
Algorithm-Hardware Co-Design of Distribution-Aware Logarithmic-Posit Encodings for Efficient DNN Inference	Mar 8, 2024	Quantization	CodeCode Available
LoCoDL: Communication-Efficient Distributed Learning with Local Training and Compression	Mar 7, 2024	Distributed OptimizationFederated Learning	—Unverified
On-demand Quantization for Green Federated Generative Diffusion in Mobile Edge Networks	Mar 7, 2024	DiversityFederated Learning	—Unverified
Adaptive Integrate-and-Fire Time Encoding Machine with Quantization	Mar 5, 2024	Quantization	—Unverified
EasyQuant: An Efficient Data-free Quantization Algorithm for LLMs	Mar 5, 2024	Data Free QuantizationQuantization	—Unverified
Design of Stochastic Quantizers for Privacy Preservation	Mar 5, 2024	Privacy PreservingQuantization	—Unverified
VQSynery: Robust Drug Synergy Prediction With Vector Quantization Mechanism	Mar 5, 2024	Quantization	—Unverified
Deep-Learned Compression for Radio-Frequency Signal Classification	Mar 5, 2024	ClassificationDecision Making	—Unverified
FlowPrecision: Advancing FPGA-Based Real-Time Fluid Flow Estimation with Linear Quantization	Mar 4, 2024	Quantization	—Unverified
Neural Network Assisted Lifting Steps For Improved Fully Scalable Lossy Image Compression in JPEG 2000	Mar 4, 2024	Image CompressionQuantization	CodeCode Available
Towards efficient deep autoencoders for multivariate time series anomaly detection	Mar 4, 2024	Anomaly DetectionModel Compression	—Unverified
Better Schedules for Low Precision Training of Deep Neural Networks	Mar 4, 2024	Node ClassificationQuantization	—Unverified
A Hierarchical Federated Learning Approach for the Internet of Things	Mar 3, 2024	Federated LearningQuantization	—Unverified
On the Compressibility of Quantized Large Language Models	Mar 3, 2024	Data CompressionQuantization	—Unverified
Extracting Usable Predictions from Quantized Networks through Uncertainty Quantification for OOD Detection	Mar 2, 2024	QuantizationUncertainty Quantification	CodeCode Available
BasedAI: A decentralized P2P network for Zero Knowledge Large Language Models (ZK-LLMs)	Mar 1, 2024	Language ModelingLanguage Modelling	—Unverified

Show:10 25 50

← PrevPage 86 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified