Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 726–750 of 4925 papers

Title	Date	Tasks	Status	Hype
Image Compression with Recurrent Neural Network and Generalized Divisive Normalization	Sep 5, 2021	DecoderImage Compression	CodeCode Available	1
Optimal Target Shape for LiDAR Pose Estimation	Sep 2, 2021	Object TrackingPose Estimation	CodeCode Available	1
Diverse Sample Generation: Pushing the Limit of Generative Data-free Quantization	Sep 1, 2021	Data Free Quantizationimage-classification	CodeCode Available	1
Compact representations of convolutional neural networks via weight pruning and quantization	Aug 28, 2021	Quantization	CodeCode Available	1
Dynamic Network Quantization for Efficient Video Inference	Aug 23, 2021	QuantizationVideo Recognition	CodeCode Available	1
FOX-NAS: Fast, On-device and Explainable Neural Architecture Search	Aug 14, 2021	CPUNeural Architecture Search	CodeCode Available	1
Generalizable Mixed-Precision Quantization via Attribution Rank Preservation	Aug 5, 2021	Quantization	CodeCode Available	1
Jointly Optimizing Query Encoder and Product Quantization to Improve Retrieval Performance	Aug 2, 2021	CPUGPU	CodeCode Available	1
Uniformity in Heterogeneity:Diving Deep into Count Interval Partition for Crowd Counting	Jul 27, 2021	Crowd CountingQuantization	CodeCode Available	1
SimCC: a Simple Coordinate Classification Perspective for Human Pose Estimation	Jul 7, 2021	ClassificationPose Estimation	CodeCode Available	1
BAGUA: Scaling up Distributed Learning with System Relaxations	Jul 3, 2021	Distributed OptimizationQuantization	CodeCode Available	1
Secure Quantized Training for Deep Learning	Jul 1, 2021	Deep LearningQuantization	CodeCode Available	1
APNN-TC: Accelerating Arbitrary Precision Neural Networks on Ampere GPU Tensor Cores	Jun 23, 2021	GPUQuantization	CodeCode Available	1
VQMIVC: Vector Quantization and Mutual Information-Based Unsupervised Speech Representation Disentanglement for One-shot Voice Conversion	Jun 18, 2021	DisentanglementQuantization	CodeCode Available	1
Task-driven Semantic Coding via Reinforcement Learning	Jun 7, 2021	Face DetectionLicense Plate Detection	CodeCode Available	1
Transferable Sparse Adversarial Attack	May 31, 2021	Adversarial AttackQuantization	CodeCode Available	1
Linear-Time Self Attention with Codeword Histogram for Efficient Recommendation	May 28, 2021	QuantizationSequential Recommendation	CodeCode Available	1
Post-Training Sparsity-Aware Quantization	May 23, 2021	Quantization	CodeCode Available	1
Extremely Lightweight Quantization Robust Real-Time Single-Image Super Resolution for Mobile Devices	May 21, 2021	image-classificationImage Classification	CodeCode Available	1
Anchor-based Plain Net for Mobile Image Super-Resolution	May 20, 2021	Image Super-ResolutionQuantization	CodeCode Available	1
Continual Learning via Bit-Level Information Preserving	May 10, 2021	Continual LearningQuantization	CodeCode Available	1
Joint Learning of Deep Retrieval Model and Product Quantization based Embedding Index	May 9, 2021	QuantizationRetrieval	CodeCode Available	1
Pareto-Optimal Quantized ResNet Is Mostly 4-bit	May 7, 2021	Quantization	CodeCode Available	1
Binarized Aggregated Network with Quantization: Flexible Deep Learning Deployment for CSI Feedback in Massive MIMO System	May 1, 2021	BinarizationQuantization	CodeCode Available	1
ActNN: Reducing Training Memory Footprint via 2-Bit Activation Compressed Training	Apr 29, 2021	Quantization	CodeCode Available	1

Show:10 25 50

← PrevPage 30 of 197Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified