Quantization

Quantization is a promising technique to reduce the computation cost of neural network training, which can replace high-cost floating-point numbers (e.g., float32) with low-cost fixed-point numbers (e.g., int8/int16).

Source: Adaptive Precision Training: Quantify Back Propagation in Neural Networks with Fixed-point Numbers

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3551–3600 of 4925 papers

Title	Date	Tasks	Status	Hype
Computational data analysis for first quantization estimation on JPEG double compressed images	Jan 10, 2021	Quantization	CodeCode Available	0
Quantization optimized with respect to the Haar basis	Jan 9, 2021	Quantization	—Unverified	0
Who's a Good Boy? Reinforcing Canine Behavior in Real-Time using Machine Learning	Jan 7, 2021	BIG-bench Machine Learningimage-classification	CodeCode Available	0
Noise Sensitivity-Based Energy Efficient and Robust Adversary Detection in Neural Networks	Jan 5, 2021	QuantizationSensitivity	—Unverified	0
I-BERT: Integer-only BERT Quantization	Jan 5, 2021	GPUNatural Language Inference	CodeCode Available	2
Improving Low-Precision Network Quantization via Bin Regularization	Jan 1, 2021	Quantization	—Unverified	0
Uniformity in Heterogeneity: Diving Deep Into Count Interval Partition for Crowd Counting	Jan 1, 2021	Crowd CountingQuantization	CodeCode Available	1
RangeDet: In Defense of Range View for LiDAR-Based 3D Object Detection	Jan 1, 2021	3D Object Detectionobject-detection	CodeCode Available	1
Product Quantizer Aware Inverted Index for Scalable Nearest Neighbor Search	Jan 1, 2021	Quantization	—Unverified	0
Improving Neural Network Efficiency via Post-Training Quantization With Adaptive Floating-Point	Jan 1, 2021	Model CompressionQuantization	CodeCode Available	1
Practical Locally Private Federated Learning with Communication Efficiency	Jan 1, 2021	Federated LearningPrivacy Preserving	—Unverified	0
Explore the Potential of CNN Low Bit Training	Jan 1, 2021	Quantization	—Unverified	0
Incremental few-shot learning via vector quantization in deep embedded space	Jan 1, 2021	class-incremental learningClass Incremental Learning	—Unverified	0
Post-Training Weighted Quantization of Neural Networks for Language Models	Jan 1, 2021	Model CompressionQuantization	—Unverified	0
WrapNet: Neural Net Inference with Ultra-Low-Precision Arithmetic	Jan 1, 2021	Quantization	—Unverified	0
Multi-Prize Lottery Ticket Hypothesis: Finding Generalizable and Efficient Binary Subnetworks in a Randomly Weighted Neural Network	Jan 1, 2021	Quantization	—Unverified	0
Uniform-Precision Neural Network Quantization via Neural Channel Expansion	Jan 1, 2021	Neural Architecture SearchQuantization	—Unverified	0
TwinDNN: A Tale of Two Deep Neural Networks	Jan 1, 2021	image-classificationImage Classification	—Unverified	0
Weights Having Stable Signs Are Important: Finding Primary Subnetworks and Kernels to Compress Binary Weight Networks	Jan 1, 2021	Quantization	—Unverified	0
Improving the accuracy of neural networks in analog computing-in-memory systems by a generalized quantization method	Jan 1, 2021	image-classificationImage Classification	—Unverified	0
End-to-end Quantized Training via Log-Barrier Extensions	Jan 1, 2021	Quantization	—Unverified	0
WAVEQ: GRADIENT-BASED DEEP QUANTIZATION OF NEURAL NETWORKS THROUGH SINUSOIDAL REGULARIZATION	Jan 1, 2021	Quantization	CodeCode Available	0
Simple Augmentation Goes a Long Way: ADRL for DNN Quantization	Jan 1, 2021	Deep Reinforcement LearningQuantization	—Unverified	0
Semi-Relaxed Quantization with DropBits: Training Low-Bit Neural Networks via Bitwise Regularization	Jan 1, 2021	Quantization	—Unverified	0
Hybrid and Non-Uniform DNN quantization methods using Retro Synthesis data for efficient inference	Jan 1, 2021	Quantization	—Unverified	0
DQSGD: DYNAMIC QUANTIZED STOCHASTIC GRADIENT DESCENT FOR COMMUNICATION-EFFICIENT DISTRIBUTED LEARNING	Jan 1, 2021	Quantization	—Unverified	0
Collaborative Filtering with Smooth Reconstruction of the Preference Function	Jan 1, 2021	Collaborative FilteringQuantization	—Unverified	0
Learned Multi-Resolution Variable-Rate Image Compression with Octave-based Residual Blocks	Dec 31, 2020	DecoderImage Compression	—Unverified	0
BinaryBERT: Pushing the Limit of BERT Quantization	Dec 31, 2020	BinarizationModel Compression	—Unverified	0
A Memory Efficient Baseline for Open Domain Question Answering	Dec 30, 2020	Dimensionality ReductionOpen-Domain Question Answering	CodeCode Available	1
Improving Adversarial Robustness in Weight-quantized Neural Networks	Dec 29, 2020	Adversarial RobustnessQuantization	—Unverified	0
Hybrid and Non-Uniform quantization methods using retro synthesis data for efficient inference	Dec 26, 2020	Quantization	—Unverified	0
Direct Quantization for Training Highly Accurate Low Bit-width Deep Neural Networks	Dec 26, 2020	image-classificationImage Classification	—Unverified	0
Comprehensive Graph-conditional Similarity Preserving Network for Unsupervised Cross-modal Hashing	Dec 25, 2020	QuantizationRetrieval	CodeCode Available	1
FracTrain: Fractionally Squeezing Bit Savings Both Temporally and Spatially for Efficient DNN Training	Dec 24, 2020	Quantization	CodeCode Available	1
EQ-Net: A Unified Deep Learning Framework for Log-Likelihood Ratio Estimation and Quantization	Dec 23, 2020	GPUQuantization	—Unverified	0
Energy Efficient Federated Learning over Heterogeneous Mobile Devices via Joint Design of Weight Quantization and Wireless Transmission	Dec 21, 2020	Edge-computingFederated Learning	—Unverified	0
DAQ: Channel-Wise Distribution-Aware Quantization for Deep Image Super-Resolution Networks	Dec 21, 2020	Image Super-ResolutionQuantization	CodeCode Available	1
Study of Energy-Efficient Distributed RLS-based Learning with Coarsely Quantized Signals	Dec 20, 2020	parameter estimationQuantization	—Unverified	0
One-Bit Target Detection in Collocated MIMO Radar and Performance Degradation Analysis	Dec 19, 2020	FormQuantization	—Unverified	0
Resource-efficient DNNs for Keyword Spotting using Neural Architecture Search and Quantization	Dec 18, 2020	Keyword SpottingNeural Architecture Search	CodeCode Available	0
FantastIC4: A Hardware-Software Co-Design Approach for Efficiently Running 4bit-Compact Multilayer Perceptrons	Dec 17, 2020	Quantization	—Unverified	0
SpAtten: Efficient Sparse Attention Architecture with Cascade Token and Head Pruning	Dec 17, 2020	CPUGPU	—Unverified	0
Efficient CNN-LSTM based Image Captioning using Neural Network Compression	Dec 17, 2020	DecoderImage Captioning	CodeCode Available	0
CosSGD: Communication-Efficient Federated Learning with a Simple Cosine-Based Quantization	Dec 15, 2020	Federated Learningimage-classification	—Unverified	0
Exploring Neural Networks Quantization via Layer-Wise Quantization Analysis	Dec 15, 2020	Quantization	—Unverified	0
Scalable Verification of Quantized Neural Networks (Technical Report)	Dec 15, 2020	Computational EfficiencyQuantization	CodeCode Available	0
Robust Downlink Transmit Optimization under Quantized Channel Feedback via the Strong Duality for QCQP	Dec 14, 2020	Quantizationvalid	—Unverified	0
Quantizing data for distributed learning	Dec 14, 2020	Quantization	—Unverified	0
Predicting Generalization in Deep Learning via Local Measures of Distortion	Dec 13, 2020	Deep LearningQuantization	—Unverified	0

Show:10 25 50

← PrevPage 72 of 99Next →

All datasets ImageNet CIFAR-10 Wiki-40B AgeDB-30 CFP-FP COCO (Common Objects in Context)IJB-B IJB-C Knowledge-based:LFW

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	FQ-ViT (ViT-L)	Top-1 Accuracy (%)	85.03	—	Unverified
2	FQ-ViT (ViT-B)	Top-1 Accuracy (%)	83.31	—	Unverified
3	FQ-ViT (Swin-B)	Top-1 Accuracy (%)	82.97	—	Unverified
4	FQ-ViT (Swin-S)	Top-1 Accuracy (%)	82.71	—	Unverified
5	FQ-ViT (DeiT-B)	Top-1 Accuracy (%)	81.2	—	Unverified
6	FQ-ViT (Swin-T)	Top-1 Accuracy (%)	80.51	—	Unverified
7	FQ-ViT (DeiT-S)	Top-1 Accuracy (%)	79.17	—	Unverified
8	Xception W8A8	Top-1 Accuracy (%)	78.97	—	Unverified
9	ADLIK-MO-ResNet50-W4A4	Top-1 Accuracy (%)	77.88	—	Unverified
10	ADLIK-MO-ResNet50-W3A4	Top-1 Accuracy (%)	77.34	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_3	MAP	160,327.04	—	Unverified
2	DTQ	MAP	0.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	OutEffHop-Bert_base	Perplexity	6.3	—	Unverified
2	OutEffHop-Bert_base	Perplexity	6.21	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	98.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	92.92	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SSD ResNet50 V1 FPN 640x640	MAP	34.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	95.13	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		TAR @ FAR=1e-4	96.38	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	3DCNN_VIVA_5	All	84,809,664	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1		Accuracy	99.8	—	Unverified