Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3001–3050 of 4925 papers

Title	Date	Tasks	Status	Hype
Data-Driven Deep Learning Based Hybrid Beamforming for Aerial Massive MIMO-OFDM Systems with Implicit CSI	Jan 18, 2022	QuantizationTransfer Learning	—Unverified	0
Design Space Exploration of Dense and Sparse Mapping Schemes for RRAM Architectures	Jan 18, 2022	Quantization	—Unverified	0
Tk-merge: Computationally Efficient Robust Clustering Under General Assumptions	Jan 17, 2022	ClusteringQuantization	—Unverified	0
Improving Performance of Semantic Segmentation CycleGANs by Noise Injection into the Latent Segmentation Space	Jan 17, 2022	Image ReconstructionQuantization	—Unverified	0
VAQF: Fully Automatic Software-Hardware Co-Design Framework for Low-Bit Vision Transformer	Jan 17, 2022	High-Level SynthesisQuantization	—Unverified	0
Neural Network Compression of ACAS Xu Early Prototype is Unsafe: Closed-Loop Verification through Quantized State Backreachability	Jan 17, 2022	Collision AvoidanceNeural Network Compression	CodeCode Available	0
UWC: Unit-wise Calibration Towards Rapid Network Compression	Jan 17, 2022	Quantization	—Unverified	0
Egeria: Efficient DNN Training with Knowledge-Guided Layer Freezing	Jan 17, 2022	Quantization	—Unverified	0
Boosted Dense Retriever	Jan 16, 2022	QuantizationRetrieval	—Unverified	0
UDC: Unified DNAS for Compressible TinyML Models	Jan 15, 2022	Model CompressionNeural Architecture Search	—Unverified	0
ViT2Hash: Unsupervised Information-Preserving Hashing	Jan 14, 2022	Quantization	—Unverified	0
Progressively Optimized Bi-Granular Document Representation for Scalable Embedding Based Retrieval	Jan 14, 2022	QuantizationRetrieval	CodeCode Available	1
A Planck Radiation and Quantization Scheme for Human Cognition and Language	Jan 10, 2022	Quantization	—Unverified	0
A Physics-Informed Vector Quantized Autoencoder for Data Compression of Turbulent Flow	Jan 10, 2022	Data CompressionQuantization	CodeCode Available	0
Bandlimited signal reconstruction from leaky integrate-and-fire encoding using POCS	Jan 9, 2022	QuantizationRetrieval	—Unverified	0
An Adaptive Device-Edge Co-Inference Framework Based on Soft Actor-Critic	Jan 9, 2022	CPUDeep Reinforcement Learning	—Unverified	0
PocketNN: Integer-only Training and Inference of Neural Networks via Direct Feedback Alignment and Pocket Activations in Pure C++	Jan 8, 2022	Quantization	CodeCode Available	1
High-contrast, speckle-free, true 3D holography via binary CGH optimization	Jan 7, 2022	3D HolographyQuantization	—Unverified	0
Video Coding for Machines: Partial transmission of SIFT features	Jan 7, 2022	Quantization	—Unverified	0
Optimizing the Communication-Accuracy Trade-off in Federated Learning with Rate-Distortion Theory	Jan 7, 2022	Federated LearningQuantization	CodeCode Available	0
Detection of extragalactic Ultra-Compact Dwarfs and Globular Clusters using Explainable AI techniques	Jan 5, 2022	Feature ImportanceQuantization	CodeCode Available	0
A Robust Visual Sampling Model Inspired by Receptive Field	Jan 4, 2022	Quantization	—Unverified	0
Elastic Product Quantization for Time Series	Jan 4, 2022	QuantizationTime Series	CodeCode Available	0
IQDUBBING: Prosody modeling based on discrete self-supervised speech representation for expressive voice conversion	Jan 2, 2022	QuantizationVoice Conversion	—Unverified	0
Quantization-Aware Deep Optics for Diffractive Snapshot Hyperspectral Imaging	Jan 1, 2022	Quantization	—Unverified	0
Channel Balancing for Accurate Quantization of Winograd Convolutions	Jan 1, 2022	Quantization	—Unverified	0
Improving Robustness Against Stealthy Weight Bit-Flip Attacks by Output Code Matching	Jan 1, 2022	Quantization	CodeCode Available	0
Instance-Aware Dynamic Neural Network Quantization	Jan 1, 2022	Quantization	CodeCode Available	0
Data-Free Network Compression via Parametric Non-Uniform Mixed Precision Quantization	Jan 1, 2022	Quantization	—Unverified	0
Learnable Lookup Table for Neural Network Quantization	Jan 1, 2022	Computational Efficiencyimage-classification	CodeCode Available	1
Mutual Quantization for Cross-Modal Search With Noisy Labels	Jan 1, 2022	Quantization	—Unverified	0
AlignQ: Alignment Quantization With ADMM-Based Correlation Preservation	Jan 1, 2022	Quantization	CodeCode Available	1
Mr.BiQ: Post-Training Non-Uniform Quantization Based on Minimizing the Reconstruction Error	Jan 1, 2022	BinarizationQuantization	—Unverified	0
RecDis-SNN: Rectifying Membrane Potential Distribution for Directly Training Spiking Neural Networks	Jan 1, 2022	Quantization	—Unverified	0
SceneSqueezer: Learning To Compress Scene for Camera Relocalization	Jan 1, 2022	Camera RelocalizationImage Registration	—Unverified	0
ERNIE-ViLG: Unified Generative Pre-training for Bidirectional Vision-Language Generation	Dec 31, 2021	Image CaptioningImage Generation	CodeCode Available	1
Croesus: Multi-Stage Processing and Transactions for Video-Analytics in Edge-Cloud Systems	Dec 31, 2021	Model Compressionobject-detection	—Unverified	0
Studying the Interplay between Information Loss and Operation Loss in Representations for Classification	Dec 30, 2021	FormQuantization	—Unverified	0
Finding the Task-Optimal Low-Bit Sub-Distribution in Deep Neural Networks	Dec 30, 2021	CPUimage-classification	CodeCode Available	1
Automatic Mixed-Precision Quantization Search of BERT	Dec 30, 2021	Knowledge DistillationModel Compression	—Unverified	0
End-to-End Autoencoder Communications with Optimized Interference Suppression	Dec 29, 2021	DecoderGenerative Adversarial Network	—Unverified	0
HiKonv: High Throughput Quantized Convolution With Novel Bit-wise Management and Computation	Dec 28, 2021	CPUManagement	—Unverified	0
Speedup deep learning models on GPU by taking advantage of efficient unstructured pruning and bit-width reduction	Dec 28, 2021	GPUQuantization	—Unverified	0
Learning Cross-Scale Weighted Prediction for Efficient Neural Video Compression	Dec 26, 2021	Motion CompensationOptical Flow Estimation	CodeCode Available	1
BMPQ: Bit-Gradient Sensitivity Driven Mixed-Precision Quantization of DNNs from Scratch	Dec 24, 2021	QuantizationSensitivity	—Unverified	0
Stochastic Learning Equation using Monotone Increasing Resolution of Quantization	Dec 24, 2021	global-optimizationQuantization	—Unverified	0
Training Quantized Deep Neural Networks via Cooperative Coevolution	Dec 23, 2021	Evolutionary AlgorithmsQuantization	CodeCode Available	1
Distilling the Knowledge of Romanian BERTs Using Multiple Teachers	Dec 23, 2021	Dialect IdentificationGPU	CodeCode Available	0
Manifold learning via quantum dynamics	Dec 20, 2021	ClusteringDimensionality Reduction	—Unverified	0
Accurate Neural Training with 4-bit Matrix Multiplications at Standard Formats	Dec 19, 2021	Quantization	—Unverified	0

Show:10 25 50

← PrevPage 61 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified