Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2451–2475 of 4925 papers

Title	Date	Tasks	Status
Leveraging Pretrained Image-text Models for Improving Audio-Visual Learning	Sep 8, 2023	audio-visual learningQuantization	—Unverified
Distributed Optimization via Gradient Descent with Event-Triggered Zooming over Quantized Communication	Sep 8, 2023	Distributed OptimizationQuantization	—Unverified
HDR Imaging With One-Bit Quantization	Sep 7, 2023	Quantization	—Unverified
Training Acceleration of Low-Rank Decomposed Networks using Sequential Freezing and Rank Quantization	Sep 7, 2023	Model CompressionQuantization	—Unverified
Norm Tweaking: High-performance Low-bit Quantization of Large Language Models	Sep 6, 2023	Model CompressionQuantization	—Unverified
Bandwidth-efficient Inference for Neural Image Compression	Sep 6, 2023	Data CompressionImage Compression	—Unverified
RobustEdge: Low Power Adversarial Detection for Cloud-Edge Systems	Sep 5, 2023	Adversarial RobustnessQuantization	—Unverified
QuantEase: Optimization-based Quantization for Language Models	Sep 5, 2023	GPUQuantization	—Unverified
Compressing Vision Transformers for Low-Resource Visual Learning	Sep 5, 2023	Autonomous Navigationimage-classification	CodeCode Available
A survey on efficient vision transformers: algorithms, techniques, and performance benchmarking	Sep 5, 2023	BenchmarkingKnowledge Distillation	—Unverified
On-Chip Hardware-Aware Quantization for Mixed Precision Neural Networks	Sep 5, 2023	Quantization	—Unverified
On the fly Deep Neural Network Optimization Control for Low-Power Computer Vision	Sep 4, 2023	Quantization	—Unverified
Softmax Bias Correction for Quantized Generative Models	Sep 4, 2023	Language ModelingLanguage Modelling	—Unverified
eDKM: An Efficient and Accurate Train-time Weight Clustering for Large Language Models	Sep 2, 2023	ClusteringCPU	—Unverified
Learning Category Trees for ID-Based Recommendation: Exploring the Power of Differentiable Vector Quantization	Aug 31, 2023	Click-Through Rate PredictionCollaborative Filtering	CodeCode Available
Implementation and Evaluation of Physical Layer Key Generation on SDR based LoRa Platform	Aug 30, 2023	Quantization	—Unverified
FPTQ: Fine-grained Post-Training Quantization for Large Language Models	Aug 30, 2023	Quantization	—Unverified
Uncovering the Hidden Cost of Model Compression	Aug 29, 2023	modelModel Compression	CodeCode Available
Continual Learning for Generative Retrieval over Dynamic Corpora	Aug 29, 2023	Continual LearningQuantization	CodeCode Available
Low-bit Quantization for Deep Graph Neural Networks with Smoothness-aware Message Propagation	Aug 29, 2023	Graph Neural NetworkNode Classification	CodeCode Available
On-Device Learning with Binary Neural Networks	Aug 29, 2023	Continual LearningQuantization	—Unverified
MEMORY-VQ: Compression for Tractable Internet-Scale Memory	Aug 28, 2023	QuantizationRetrieval	—Unverified
Maestro: Uncovering Low-Rank Structures via Trainable Decomposition	Aug 28, 2023	Low-rank compressionQuantization	CodeCode Available
A2Q: Accumulator-Aware Quantization with Guaranteed Overflow Avoidance	Aug 25, 2023	Quantization	CodeCode Available
Efficient Learned Lossless JPEG Recompression	Aug 25, 2023	GPUImage Compression	—Unverified

Show:10 25 50

← PrevPage 99 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified