Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2751–2800 of 4925 papers

Title	Date	Tasks	Status	Hype
BL-JUNIPER: A CNN-Assisted Framework for Perceptual Video Coding Leveraging Block-Level JND	Jun 29, 2022	Quantization	CodeCode Available	1
Supervised Deep Hashing for High-dimensional and Heterogeneous Case-based Reasoning	Jun 29, 2022	Deep HashingIncremental Learning	—Unverified	0
Multi-user Downlink Beamforming using Uplink Downlink Duality with 1-bit Converters for Flat Fading Channels	Jun 29, 2022	Quantization	—Unverified	0
Fundamental Limits of Communication Efficiency for Model Aggregation in Distributed Learning: A Rate-Distortion Approach	Jun 28, 2022	Model CompressionQuantization	—Unverified	0
QTI Submission to DCASE 2021: residual normalization for device-imbalanced acoustic scene classification with efficient design	Jun 28, 2022	Acoustic Scene ClassificationKnowledge Distillation	—Unverified	0
CTMQ: Cyclic Training of Convolutional Neural Networks with Multiple Quantization Steps	Jun 26, 2022	Quantization	—Unverified	0
Cactus Mechanisms: Optimal Differential Privacy Mechanisms in the Large-Composition Regime	Jun 25, 2022	Quantization	—Unverified	0
Inverted Semantic-Index for Image Retrieval	Jun 25, 2022	Clusteringimage-classification	—Unverified	0
Computational Complexity Evaluation of Neural Network Applications in Signal Processing	Jun 24, 2022	Quantization	—Unverified	0
Megapixel Image Generation with Step-Unrolled Denoising Autoencoders	Jun 24, 2022	DenoisingGPU	CodeCode Available	0
QReg: On Regularization Effects of Quantization	Jun 24, 2022	FormQuantization	—Unverified	0
Open-source FPGA-ML codesign for the MLPerf Tiny Benchmark	Jun 23, 2022	Anomaly Detectionimage-classification	CodeCode Available	0
A Federated Reinforcement Learning Method with Quantization for Cooperative Edge Caching in Fog Radio Access Networks	Jun 23, 2022	Deep Reinforcement LearningQuantization	—Unverified	0
Automated Cancer Subtyping via Vector Quantization Mutual Information Maximization	Jun 22, 2022	ClusteringQuantization	CodeCode Available	0
Proximity Graph Maintenance for Fast Online Nearest Neighbor Search	Jun 22, 2022	QuantizationRecommendation Systems	—Unverified	0
Quantization Robust Federated Learning for Efficient Inference on Heterogeneous Devices	Jun 22, 2022	BIG-bench Machine LearningFederated Learning	—Unverified	0
Asymmetric Learned Image Compression with Multi-Scale Residual Block, Importance Map, and Post-Quantization Filtering	Jun 21, 2022	DecoderImage Compression	—Unverified	0
QuantFace: Towards Lightweight Face Recognition by Synthetic Data Low-bit Quantization	Jun 21, 2022	Face RecognitionLightweight Face Recognition	CodeCode Available	1
sqSGD: Locally Private and Communication Efficient Federated Learning	Jun 21, 2022	Federated LearningPrivacy Preserving	—Unverified	0
Self-Supervised Consistent Quantization for Fully Unsupervised Image Retrieval	Jun 20, 2022	Contrastive LearningImage Retrieval	—Unverified	0
Low-Precision Stochastic Gradient Langevin Dynamics	Jun 20, 2022	Deep LearningQuantization	CodeCode Available	0
LUT-GEMM: Quantized Matrix Multiplication based on LUTs for Efficient Inference in Large-Scale Generative Language Models	Jun 20, 2022	GPUQuantization	CodeCode Available	1
Seizure Detection and Prediction by Parallel Memristive Convolutional Neural Networks	Jun 20, 2022	EEGElectroencephalogram (EEG)	CodeCode Available	1
Towards Efficient Active Learning of PDFA	Jun 17, 2022	Active LearningQuantization	CodeCode Available	0
FedNew: A Communication-Efficient and Privacy-Preserving Newton-Type Method for Federated Learning	Jun 17, 2022	Federated LearningPrivacy Preserving	CodeCode Available	1
Channel-wise Mixed-precision Assignment for DNN Inference on Constrained Edge Nodes	Jun 17, 2022	Neural Architecture SearchQuantization	CodeCode Available	0
Lossy Compression with Gaussian Diffusion	Jun 17, 2022	Quantization	CodeCode Available	1
Fast Lossless Neural Compression with Integer-Only Discrete Flows	Jun 17, 2022	Quantization	CodeCode Available	1
tinySNN: Towards Memory- and Energy-Efficient Spiking Neural Networks	Jun 17, 2022	Quantization	—Unverified	0
Accelerating Inference and Language Model Fusion of Recurrent Neural Network Transducers via End-to-End 4-bit Quantization	Jun 16, 2022	Language ModelingLanguage Modelling	—Unverified	0
PeQuENet: Perceptual Quality Enhancement of Compressed Video with Adaptation- and Attention-based Network	Jun 16, 2022	Generative Adversarial NetworkQuantization	CodeCode Available	1
Compressed-VFL: Communication-Efficient Learning with Vertically Partitioned Data	Jun 16, 2022	Federated LearningQuantization	—Unverified	0
Hardening DNNs against Transfer Attacks during Network Compression using Greedy Adversarial Pruning	Jun 15, 2022	Adversarial RobustnessQuantization	CodeCode Available	0
Edge Inference with Fully Differentiable Quantized Mixed Precision Neural Networks	Jun 15, 2022	Edge-computingQuantization	—Unverified	0
QONNX: Representing Arbitrary-Precision Quantized Neural Networks	Jun 15, 2022	Quantization	CodeCode Available	1
Federated Optimization Algorithms with Random Reshuffling and Gradient Compression	Jun 14, 2022	Federated LearningQuantization	CodeCode Available	1
Towards Alternative Techniques for Improving Adversarial Robustness: Analysis of Adversarial Training at a Spectrum of Perturbations	Jun 13, 2022	Adversarial RobustnessQuantization	CodeCode Available	0
Optimal Clipping and Magnitude-aware Differentiation for Improved Quantization-aware Training	Jun 13, 2022	Quantization	CodeCode Available	0
Why Quantization Improves Generalization: NTK of Binary Weight Neural Networks	Jun 13, 2022	Quantization	—Unverified	0
Preprocessing Enhanced Image Compression for Machine Vision	Jun 12, 2022	Image Compressionobject-detection	—Unverified	0
A Directed-Evolution Method for Sparsification and Compression of Neural Networks with Application to Object Identification and Segmentation and considerations of optimal quantization using small number of bits	Jun 12, 2022	Quantization	—Unverified	0
Convex Quantization Preserves Logconcavity	Jun 11, 2022	Quantization	—Unverified	0
Real-time Hyper-Dimensional Reconfiguration at the Edge using Hardware Accelerators	Jun 10, 2022	Few-Shot LearningQuantization	—Unverified	0
SDQ: Stochastic Differentiable Quantization with Mixed Precision	Jun 9, 2022	Knowledge DistillationNeural Architecture Search	—Unverified	0
HideNseek: Federated Lottery Ticket via Server-side Pruning and Sign Supermask	Jun 9, 2022	Federated LearningModel Compression	—Unverified	0
Memory-Oriented Design-Space Exploration of Edge-AI Hardware for XR Applications	Jun 8, 2022	CPUHand Detection	—Unverified	0
Gradient Obfuscation Gives a False Sense of Security in Federated Learning	Jun 8, 2022	Federated Learningimage-classification	—Unverified	0
Low-complexity acoustic scene classification in DCASE 2022 Challenge	Jun 8, 2022	Acoustic Scene ClassificationClassification	—Unverified	0
Enhancing Strong PUF Security with Non-monotonic Response Quantization	Jun 7, 2022	Quantization	—Unverified	0
Learning Binarized Graph Representations with Multi-faceted Quantization Reinforcement for Top-K Recommendation	Jun 5, 2022	BinarizationInformativeness	—Unverified	0

Show:10 25 50

← PrevPage 56 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified