Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2226–2250 of 4925 papers

Title	Date	Tasks	Status
Within-basket Recommendation via Neural Pattern Associator	Jan 25, 2024	Quantization	—Unverified
Value-Driven Mixed-Precision Quantization for Patch-Based Inference on Microcontrollers	Jan 24, 2024	Quantization	—Unverified
Iterated Relevance Matrix Analysis (IRMA) for the identification of class-discriminative subspaces	Jan 23, 2024	Dimensionality ReductionQuantization	—Unverified
Scaling Up Quantization-Aware Neural Architecture Search for Efficient Deep Learning on the Edge	Jan 22, 2024	Neural Architecture SearchQuantization	—Unverified
Robustness to distribution shifts of compressed networks for edge devices	Jan 22, 2024	Knowledge DistillationQuantization	—Unverified
Another Way to the Top: Exploit Contextual Clustering in Learned Image Coding	Jan 21, 2024	ClusteringImage Compression	—Unverified
Edge-Enabled Real-time Railway Track Segmentation	Jan 21, 2024	GPUQuantization	—Unverified
LRP-QViT: Mixed-Precision Vision Transformer Quantization via Layer-wise Relevance Propagation	Jan 20, 2024	Quantization	—Unverified
Dynamic Q&A of Clinical Documents with Large Language Models	Jan 19, 2024	ChatbotDecision Making	—Unverified
A2Q+: Improving Accumulator-Aware Weight Quantization	Jan 19, 2024	Quantization	CodeCode Available
Model Compression Techniques in Biometrics Applications: A Survey	Jan 18, 2024	FairnessKnowledge Distillation	CodeCode Available
Enabling On-device Continual Learning with Binary Neural Networks	Jan 18, 2024	Continual LearningQuantization	—Unverified
Exploration of Activation Fault Reliability in Quantized Systolic Array-Based DNN Accelerators	Jan 17, 2024	Quantization	—Unverified
Hybrid of DiffStride and Spectral Pooling in Convolutional Neural Networks	Jan 17, 2024	Quantization	—Unverified
Hardware Acceleration for Real-Time Wildfire Detection Onboard Drone Networks	Jan 16, 2024	Classificationimage-classification	CodeCode Available
Activations and Gradients Compression for Model-Parallel Training	Jan 15, 2024	image-classificationImage Classification	CodeCode Available
TP-Aware Dequantization	Jan 15, 2024	GPUQuantization	—Unverified
MorpheusNet: Resource efficient sleep stage classifier for embedded on-line systems	Jan 14, 2024	Quantization	CodeCode Available
ENTED: Enhanced Neural Texture Extraction and Distribution for Reference-based Blind Face Restoration	Jan 13, 2024	Blind Face RestorationQuantization	—Unverified
Correlated Quantization for Faster Nonconvex Distributed Optimization	Jan 10, 2024	Distributed OptimizationQuantization	—Unverified
Memory-Efficient Fine-Tuning for Quantized Diffusion Model	Jan 9, 2024	modelQuantization	—Unverified
FlightLLM: Efficient Large Language Model Inference with a Complete Mapping Flow on FPGAs	Jan 8, 2024	Computational EfficiencyGPU	—Unverified
Detecting Face Synthesis Using a Concealed Fusion Model	Jan 8, 2024	Computer SecurityFace Generation	—Unverified
A Video Coding Method Based on Neural Network for CLIC2024	Jan 8, 2024	Deep LearningQuantization	—Unverified
Data-driven Dynamic Event-triggered Control	Jan 7, 2024	Quantization	—Unverified

Show:10 25 50

← PrevPage 90 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified