Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2701–2750 of 4925 papers

Title	Date	Tasks	Status
Low Rank Optimization for Efficient Deep Learning: Making A Balance between Compact Architecture and Fast Training	Mar 22, 2023	Model CompressionQuantization	—Unverified
Fighting over-fitting with quantization for learning deep neural networks on noisy labels	Mar 21, 2023	Action Unit DetectionFacial Action Unit Detection	—Unverified
Quantized Zero Dynamics Attacks against Sampled-data Control Systems	Mar 21, 2023	Quantization	—Unverified
R2 Loss: Range Restriction Loss for Model Compression and Quantization	Mar 14, 2023	ClassificationModel Compression	—Unverified
Rediscovering Hashed Random Projections for Efficient Quantization of Contextualized Sentence Embeddings	Mar 13, 2023	QuantizationSentence	CodeCode Available
Bag of Tricks with Quantized Convolutional Neural Networks for image classification	Mar 13, 2023	image-classificationImage Classification	—Unverified
Modular Quantization-Aware Training for 6D Object Pose Estimation	Mar 12, 2023	6D Pose Estimation6D Pose Estimation using RGB	CodeCode Available
Regularized Vector Quantization for Tokenized Image Synthesis	Mar 11, 2023	Image GenerationQuantization	—Unverified
Entropy Coding Improvement for Low-complexity Compressive Auto-encoders	Mar 10, 2023	QuantizationVideo Compression	—Unverified
Greener yet Powerful: Taming Large Code Generation Models with Quantization	Mar 9, 2023	Code GenerationCode Summarization	—Unverified
Dynamic Stashing Quantization for Efficient Transformer Training	Mar 9, 2023	Quantization	—Unverified
QuickSRNet: Plain Single-Image Super-Resolution Architecture for Faster Inference on Mobile Platforms	Mar 8, 2023	Image Super-ResolutionQuantization	—Unverified
A Privacy Preserving System for Movie Recommendations Using Federated Learning	Mar 7, 2023	Federated LearningPrivacy Preserving	—Unverified
ML Codebook Design for Initial Access and CSI Type-II Feedback in Sub-6GHz 5G NR	Mar 6, 2023	ManagementQuantization	—Unverified
MetaGrad: Adaptive Gradient Quantization with Hypernetworks	Mar 4, 2023	Quantization	—Unverified
Fixed-point quantization aware training for on-device keyword-spotting	Mar 4, 2023	Keyword SpottingQuantization	—Unverified
Summary Statistic Privacy in Data Sharing	Mar 3, 2023	Quantization	CodeCode Available
Ultra-low Power Deep Learning-based Monocular Relative Localization Onboard Nano-quadrotors	Mar 3, 2023	Quantization	—Unverified
Rotation Invariant Quantization for Model Compression	Mar 3, 2023	modelModel Compression	CodeCode Available
Google USM: Scaling Automatic Speech Recognition Beyond 100 Languages	Mar 2, 2023	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	—Unverified
Ternary Quantization: A Survey	Mar 2, 2023	QuantizationSurvey	—Unverified
Boosting Distributed Full-graph GNN Training with Asynchronous One-bit Communication	Mar 2, 2023	GPUQuantization	—Unverified
Comprehensive Comparisons of Uniform Quantization in Deep Image Compression	Mar 1, 2023	DecoderImage Compression	CodeCode Available
A Probabilistic Reformulation Technique for Discrete RIS Optimization in Wireless Systems	Mar 1, 2023	Quantization	—Unverified
Ultra-low Precision Multiplication-free Training for Deep Neural Networks	Feb 28, 2023	Quantization	—Unverified
Wireless End-to-End Image Transmission System using Semantic Communications	Feb 27, 2023	DecoderQuantization	—Unverified
JND-Based Perceptual Optimization For Learned Image Compression	Feb 25, 2023	Image CompressionMS-SSIM	—Unverified
The Effect of Points Dispersion on the k-nn Search in Random Projection Forests	Feb 25, 2023	Instance SearchQuantization	CodeCode Available
DyBit: Dynamic Bit-Precision Numbers for Efficient Quantized Neural Network Inference	Feb 24, 2023	Quantization	—Unverified
Teacher Intervention: Improving Convergence of Quantization Aware Training for Ultra-Low Precision Transformers	Feb 23, 2023	Knowledge DistillationQuantization	CodeCode Available
Approximate spectral clustering density-based similarity for noisy datasets	Feb 22, 2023	ClusteringGraph Clustering	CodeCode Available
HDR image watermarking using saliency detection and quantization index modulation	Feb 22, 2023	object-detectionObject Detection	—Unverified
Quantized Low-Rank Multivariate Regression with Random Dithering	Feb 22, 2023	Image RestorationQuantization	—Unverified
Refining a k-nearest neighbor graph for a computationally efficient spectral clustering	Feb 22, 2023	ClusteringComputational Efficiency	CodeCode Available
Optical Transformers	Feb 20, 2023	Quantization	—Unverified
Fixflow: A Framework to Evaluate Fixed-point Arithmetic in Light-Weight CNN Inference	Feb 19, 2023	ClassificationQuantization	—Unverified
Rethinking Data-Free Quantization as a Zero-Sum Game	Feb 19, 2023	Data Free QuantizationQuantization	CodeCode Available
An anatomy-based V1 model: Extraction of Low-level Features, Reduction of distortion and a V1-inspired SOM	Feb 18, 2023	AnatomyContour Detection	—Unverified
Evaluation of Linear Implicit Quantized State System method for analyzing mission performance of power systems	Feb 18, 2023	Computational EfficiencyQuantization	—Unverified
LiQuiD-MIMO Radar: Distributed MIMO Radar with Low-Bit Quantization	Feb 16, 2023	parameter estimationQuantization	—Unverified
Speech Enhancement with Multi-granularity Vector Quantization	Feb 16, 2023	DenoisingQuantization	—Unverified
Sparse-SignSGD with Majority Vote for Communication-Efficient Distributed Learning	Feb 15, 2023	Deep LearningDistributed Optimization	—Unverified
Towards Optimal Compression: Joint Pruning and Quantization	Feb 15, 2023	Model CompressionNeural Architecture Search	—Unverified
SEAM: Searching Transferable Mixed-Precision Quantization Policy through Large Margin Regularization	Feb 14, 2023	Quantization	—Unverified
gpcgc: a green point cloud geometry coding method	Feb 13, 2023	Quantization	—Unverified
Step by Step Loss Goes Very Far: Multi-Step Quantization for Adversarial Text Attacks	Feb 10, 2023	Adversarial TextQuantization	CodeCode Available
A Practical Mixed Precision Algorithm for Post-Training Quantization	Feb 10, 2023	Quantization	—Unverified
Feature Affinity Assisted Knowledge Distillation and Quantization of Deep Neural Networks on Label-Free Data	Feb 10, 2023	Knowledge DistillationQuantization	—Unverified
Data Quality-aware Mixed-precision Quantization via Hybrid Reinforcement Learning	Feb 9, 2023	Quantizationreinforcement-learning	—Unverified
Quantized Distributed Training of Large Models with Convergence Guarantees	Feb 5, 2023	Quantization	—Unverified

Show:10 25 50

← PrevPage 55 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified