Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2201–2225 of 4925 papers

Title	Date	Tasks	Status
Stability Analysis of Various Symbolic Rule Extraction Methods from Recurrent Neural Network	Feb 4, 2024	Quantization	—Unverified
Leveraging Continuously Differentiable Activation Functions for Learning in Quantized Noisy Environments	Feb 4, 2024	Quantization	CodeCode Available
Locally-Adaptive Quantization for Streaming Vector Search	Feb 3, 2024	QuantizationRetrieval	—Unverified
Ultrafast jet classification on FPGAs for the HL-LHC	Feb 2, 2024	Quantization	CodeCode Available
Truncated Non-Uniform Quantization for Distributed SGD	Feb 2, 2024	Quantization	—Unverified
FedShift: Tackling Dual Heterogeneity Problem of Federated Learning via Weight Shift Aggregation	Feb 2, 2024	DiversityFederated Learning	—Unverified
Faster Inference of Integer SWIN Transformer by Removing the GELU Activation	Feb 2, 2024	GPUimage-classification	—Unverified
An Intra-BRNN and GB-RVQ Based END-TO-END Neural Audio Codec	Feb 2, 2024	Quantization	—Unverified
Improved Quantization Strategies for Managing Heavy-tailed Gradients in Distributed Learning	Feb 2, 2024	Quantization	—Unverified
Neural Language of Thought Models	Feb 2, 2024	Image GenerationObject	—Unverified
SignSGD with Federated Defense: Harnessing Adversarial Attacks through Gradient Sign Decoding	Feb 2, 2024	Adversarial AttackQuantization	CodeCode Available
HW-SW Optimization of DNNs for Privacy-preserving People Counting on Low-resolution Infrared Arrays	Feb 2, 2024	Neural Architecture SearchPrivacy Preserving	—Unverified
Can Large Language Models Understand Context?	Feb 1, 2024	In-Context LearningQuantization	—Unverified
Analog-digital Scheduling for Federated Learning: A Communication-Efficient Approach	Feb 1, 2024	Federated LearningQuantization	—Unverified
Trainable Fixed-Point Quantization for Deep Learning Acceleration on FPGAs	Jan 31, 2024	Deep LearningQuantization	—Unverified
One-Step Forward and Backtrack: Overcoming Zig-Zagging in Loss-Aware Quantization Training	Jan 30, 2024	Quantization	CodeCode Available
Effect of Weight Quantization on Learning Models by Typical Case Analysis	Jan 30, 2024	Quantization	—Unverified
Effective Communication with Dynamic Feature Compression	Jan 29, 2024	Deep Reinforcement LearningFeature Compression	CodeCode Available
HEQuant: Marrying Homomorphic Encryption and Quantization for Communication-Efficient Private Inference	Jan 29, 2024	Quantization	—Unverified
Transformer-based Clipped Contrastive Quantization Learning for Unsupervised Image Retrieval	Jan 27, 2024	Contrastive LearningImage Retrieval	—Unverified
A Comprehensive Survey of Compression Algorithms for Language Models	Jan 27, 2024	Knowledge DistillationQuantization	—Unverified
MPTQ-ViT: Mixed-Precision Post-Training Quantization for Vision Transformer	Jan 26, 2024	Quantization	—Unverified
LitE-SNN: Designing Lightweight and Efficient Spiking Neural Network through Spatial-Temporal Compressive Network Search and Joint Optimization	Jan 26, 2024	Quantization	—Unverified
Within-basket Recommendation via Neural Pattern Associator	Jan 25, 2024	Quantization	—Unverified
CompactifAI: Extreme Compression of Large Language Models using Quantum-Inspired Tensor Networks	Jan 25, 2024	Model CompressionQuantization	—Unverified

Show:10 25 50

← PrevPage 89 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified