Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2101–2125 of 4925 papers

Title	Date	Tasks	Status
SignSGD with Federated Voting	Mar 25, 2024	Quantization	CodeCode Available
FlashEval: Towards Fast and Accurate Evaluation of Text-to-image Diffusion Generative Models	Mar 25, 2024	Quantization	CodeCode Available
On the Impact of Black-box Deployment Strategies for Edge AI on Latency and Model Performance	Mar 25, 2024	CPUQuantization	CodeCode Available
Neural Image Compression with Quantization Rectifier	Mar 25, 2024	Feature CorrelationImage Compression	—Unverified
GLAD: Improving Latent Graph Generative Modeling with Simple Quantization	Mar 25, 2024	Quantization	CodeCode Available
Work in Progress: Linear Transformers for TinyML	Mar 25, 2024	Keyword SpottingKeyword Spotting on Google Speech Commands	—Unverified
Magic for the Age of Quantized DNNs	Mar 22, 2024	Model CompressionQuantization	—Unverified
Infrastructure-Assisted Collaborative Perception in Automated Valet Parking: A Safety Perspective	Mar 22, 2024	Dimensionality ReductionQuantization	—Unverified
Super-High-Fidelity Image Compression via Hierarchical-ROI and Adaptive Quantization	Mar 19, 2024	Image CompressionQuantization	—Unverified
Provable Privacy with Non-Private Pre-Processing	Mar 19, 2024	ImputationQuantization	—Unverified
NoisyDECOLLE: Robust Local Learning for SNNs on Neuromorphic Hardware	Mar 19, 2024	Quantization	CodeCode Available
Floating-Point Quantization Analysis of Multi-Layer Perceptron Artificial Neural Networks	Mar 18, 2024	Quantization	CodeCode Available
Spatio-Temporal Fluid Dynamics Modeling via Physical-Awareness and Parameter Diffusion Guidance	Mar 18, 2024	Quantization	—Unverified
HyperVQ: MLR-based Vector Quantization in Hyperbolic Space	Mar 18, 2024	QuantizationRepresentation Learning	—Unverified
Decoding Compressed Trust: Scrutinizing the Trustworthiness of Efficient LLMs Under Compression	Mar 18, 2024	EthicsFairness	—Unverified
Hierarchical Frequency-based Upsampling and Refining for Compressed Video Quality Enhancement	Mar 18, 2024	QuantizationVideo Compression	—Unverified
Quantization Avoids Saddle Points in Distributed Optimization	Mar 15, 2024	Distributed OptimizationQuantization	—Unverified
Quantization Effects on Neural Networks Perception: How would quantization change the perceptual field of vision models?	Mar 15, 2024	Quantization	CodeCode Available
CRB Analysis for Mixed-ADC Based DOA Estimation	Mar 14, 2024	QuantizationSparse Learning	—Unverified
Generalized Relevance Learning Grassmann Quantization	Mar 14, 2024	Activity RecognitionFace Recognition	CodeCode Available
Adversarial Fine-tuning of Compressed Neural Networks for Joint Improvement of Robustness and Efficiency	Mar 14, 2024	Adversarial RobustnessModel Compression	CodeCode Available
FedComLoc: Communication-Efficient Distributed Training of Sparse and Quantized Models	Mar 14, 2024	Federated LearningQuantization	—Unverified
BRIEDGE: EEG-Adaptive Edge AI for Multi-Brain to Multi-Robot Interaction	Mar 14, 2024	EEGModel Compression	—Unverified
UniCode: Learning a Unified Codebook for Multimodal Large Language Models	Mar 14, 2024	QuantizationVisual Question Answering (VQA)	—Unverified
Collaborative Automotive Radar Sensing via Mixed-Precision Distributed Array Completion	Mar 13, 2024	Matrix CompletionQuantization	—Unverified

Show:10 25 50

← PrevPage 85 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified